AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
kurz:subkorpusy [2018/11/02 15:01] – [Veřejné subkorpusy] Václav Cvrčekkurz:subkorpusy [2018/12/14 13:18] Jan Kocek
Řádek 7: Řádek 7:
 Co jsou to metainformace a kde se o nich dozvíme více? [[pojmy:metadata|Metainformace]], tj. informace o názvu, autorovi, roce vydání apod., obsahuje každý text v korpusu. Lze podle nich i vyhledávat – můžeme například najít všechny texty daného autora, texty, které jsou přeložené z konkrétního jazyka nebo které byly vydány v určitém časovém rozmezí. V mluvených korpusech lze vyhledávat podle sociolingvistických údajů týkajících se mluvčích, jako je věk, vzdělání či nářeční oblast (viz specializovaná [[kurz:hledani_v_mluvenych_korpusech#vyber_textu|bonusová lekce]]).  Co jsou to metainformace a kde se o nich dozvíme více? [[pojmy:metadata|Metainformace]], tj. informace o názvu, autorovi, roce vydání apod., obsahuje každý text v korpusu. Lze podle nich i vyhledávat – můžeme například najít všechny texty daného autora, texty, které jsou přeložené z konkrétního jazyka nebo které byly vydány v určitém časovém rozmezí. V mluvených korpusech lze vyhledávat podle sociolingvistických údajů týkajících se mluvčích, jako je věk, vzdělání či nářeční oblast (viz specializovaná [[kurz:hledani_v_mluvenych_korpusech#vyber_textu|bonusová lekce]]). 
  
-[{{ :kurz:holmes-metadata.png?direct&350|Zobrazení metadat v konkordanci FIXME}}]+[{{ :kurz:holmes-metadata.png?direct&350|Zobrazení metadat v konkordanci }}]
  
 Kde najdeme seznam příslušných metainformací?  Kde najdeme seznam příslušných metainformací? 
Řádek 21: Řádek 21:
 Chceme-li např. v korpusu SYN2015 najít výskyty lemmatu //buňka// pouze v odborných textech z oboru biologie, budeme dotaz specifikovat následujícím způsobem: v kolonce **doc.txtype_group** zaškrtneme políčko **NFC: oborová**, v kolonce **doc.txtype** políčko **SCI: odborná literatura** a v kolonce **doc.genre** políčko **BIO: biologie**. Pokud chceme zjistit, kterých textů se daný výběr týká, stačí zmáčknout tlačítko **Zúžit výběr**. Objeví se okénko s aplikovaným filtrem a počtem pozic v daném výběru. Není-li už náš výběr příliš omezený, lze na něj dále aplikovat další filtry, případně jej celý zrušit kliknutím na volbu **Zrušit výběr**. Tak bychom mohli omezit původní filtr ještě požadavkem na výskyt pouze v příručkách referenčního typu (kolonka **doc.medium**), kam spadají např. encyklopedie, slovníky apod. Definitivní výběr by pak vypadal takto: Chceme-li např. v korpusu SYN2015 najít výskyty lemmatu //buňka// pouze v odborných textech z oboru biologie, budeme dotaz specifikovat následujícím způsobem: v kolonce **doc.txtype_group** zaškrtneme políčko **NFC: oborová**, v kolonce **doc.txtype** políčko **SCI: odborná literatura** a v kolonce **doc.genre** políčko **BIO: biologie**. Pokud chceme zjistit, kterých textů se daný výběr týká, stačí zmáčknout tlačítko **Zúžit výběr**. Objeví se okénko s aplikovaným filtrem a počtem pozic v daném výběru. Není-li už náš výběr příliš omezený, lze na něj dále aplikovat další filtry, případně jej celý zrušit kliknutím na volbu **Zrušit výběr**. Tak bychom mohli omezit původní filtr ještě požadavkem na výskyt pouze v příručkách referenčního typu (kolonka **doc.medium**), kam spadají např. encyklopedie, slovníky apod. Definitivní výběr by pak vypadal takto:
  
-[{{:kurz:vyber02.png?800| Výběr textů na základě metainformací FIXME}}] +[{{:kurz:vyber02.png?800| Výběr textů na základě metainformací }}] 
  
  
Řádek 76: Řádek 76:
 Subkorpusy můžeme spravovat a ty nepotřebné mazat v sekci **[[manualy:kontext:korpusy#prehled_existujicich_subkorpusu|Mé subkorpusy]]**.  Subkorpusy můžeme spravovat a ty nepotřebné mazat v sekci **[[manualy:kontext:korpusy#prehled_existujicich_subkorpusu|Mé subkorpusy]]**. 
  
-[{{:kurz:smazatsubkorpus.png?| Mé subkorpusy – možnost smazání subkorpusu FIXME}}]+[{{:kurz:smazatsubkorpus.png?| Mé subkorpusy – možnost smazání subkorpusu }}]
  
 ==== Veřejné subkorpusy ==== ==== Veřejné subkorpusy ====