AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
kurz:subkorpusy [2021/04/26 10:28] – [Trvalý subkorpus pro pokročilé: vytvoření vlastnoručním stanovením podmínek] vaclavcvrcekkurz:subkorpusy [2021/04/26 14:41] (aktuální) – [Veřejné subkorpusy] michalskrabal
Řádek 52: Řádek 52:
 Specifický subkorpus můžeme vytvořit i pomocí podmínky [[pojmy:within|within]], o níž jsme mluvili v rámci [[kurz:pokrocile_dotazy#hledani_v_ramci_jedne_vety|lekce o CQL]]. Výhodou této složitější cesty je to, že můžeme pracovat s celou škálou informací, které nám korpusový materiál nabízí, nevýhodou je její náročnost (je třeba znát jak struktury v různých korpusech, tak jednotlivé atributy i jejich hodnoty a konkrétní formát).  Specifický subkorpus můžeme vytvořit i pomocí podmínky [[pojmy:within|within]], o níž jsme mluvili v rámci [[kurz:pokrocile_dotazy#hledani_v_ramci_jedne_vety|lekce o CQL]]. Výhodou této složitější cesty je to, že můžeme pracovat s celou škálou informací, které nám korpusový materiál nabízí, nevýhodou je její náročnost (je třeba znát jak struktury v různých korpusech, tak jednotlivé atributy i jejich hodnoty a konkrétní formát). 
  
-V menu vyberte položku **Korpusy → Vytvořit nový subkorpus**. Na zobrazené stránce nejprve zvolte korpus, z něhož chcete texty vybírat (u psaných korpusů nejčastěji [[cnk:syn2020|SYN2020]] či daleko rozsáhlejší [[cnk:syn|SYN]]), a svůj nový subkorpus nezapomeňte pojmenovat. Poté zvolte možnost Specifikovat subkorpus pomocí volby: **Vlastní within podmínka**. To umožní vybrat do subkorpusu texty (v psaných korpusech) či např. mluvčí (v mluvených korpusech) odpovídající konkrétním podmínkám. V psaných korpusech se obvykle vybírají texty, tzv. **opusy** či struktury typu **doc**. Do prázdného políčka je třeba vyplnit konkrétní podmínku. Následující příklady pocházejí z korpusu SYN2015:+V menu vyberte položku **Korpusy → Vytvořit nový subkorpus**. Na zobrazené stránce nejprve zvolte korpus, z něhož chcete texty vybírat (u psaných korpusů nejčastěji [[cnk:syn2020|SYN2020]] či daleko rozsáhlejší [[cnk:syn|SYN]]), a svůj nový subkorpus nezapomeňte pojmenovat. Poté zvolte možnost Specifikovat subkorpus pomocí volby: **Vlastní within podmínka**. To umožní vybrat do subkorpusu texty (v psaných korpusech) či např. mluvčí (v mluvených korpusech) odpovídající konkrétním podmínkám. V psaných korpusech se obvykle vybírají texty, tzv. **opusy** či struktury typu **doc**. Do prázdného políčka je třeba vyplnit konkrétní podmínku. Následující příklady pocházejí z korpusu SYN2020:
  
   * ''txtype_group=%%"FIC.*"%%'' – v subkorpusu budou obsaženy všechny beletristické texty z původního korpusu   * ''txtype_group=%%"FIC.*"%%'' – v subkorpusu budou obsaženy všechny beletristické texty z původního korpusu
-  * ''author=%%"HrabalBohumil"%%'' – v subkorpusu budou obsaženy všechny texty, jejichž autorem je BHrabal (u vytváření podmínky obsahující jméno autora je vždy třeba dodržet tento konkrétní formát, případně autorovo jméno zkrátit, ale např. podmínka ''author=%%"Čapek.*"%%'' vztažená na velký korpus SYN by zahrnula texty nejen od obou bratrů Čapkových, ale též od méně známé bratrské dvojice [[http://www.databazeknih.cz/zivotopis/karel-jan-capek-4910|Karla Jana]] a [[http://www.databazeknih.cz/autori/michal-capek-10857|Michala]] Čapků)+  * ''author=%%"SoukupováPetra"%%'' – v subkorpusu budou obsaženy všechny texty, jejichž autorkou je PSoukupová (u vytváření podmínky obsahující jméno autora je vždy třeba dodržet tento konkrétní formát, případně autorovo jméno zkrátit, ale např. podmínka ''author=%%"Čapek.*"%%'' vztažená na velký korpus SYN by zahrnula texty nejen od obou bratrů Čapkových, ale též od méně známé bratrské dvojice [[http://www.databazeknih.cz/zivotopis/karel-jan-capek-4910|Karla Jana]] a [[http://www.databazeknih.cz/autori/michal-capek-10857|Michala]] Čapků)
   * ''genre=%%"BIO.*"%%'' – subkorpus zahrne všechny texty z oboru biologie    * ''genre=%%"BIO.*"%%'' – subkorpus zahrne všechny texty z oboru biologie 
   * ''pubyear=%%"200[5-9]"%%'' – subkorpus bude obsahovat všechny texty z let 2005 až 2009    * ''pubyear=%%"200[5-9]"%%'' – subkorpus bude obsahovat všechny texty z let 2005 až 2009 
Řádek 84: Řádek 84:
 Unikátní klíč lze zobrazit, pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku drobečkové navigace pod logem KonText). Unikátní klíč lze zobrazit, pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku drobečkové navigace pod logem KonText).
  
-Korpus je pak možné vyvolat v měnu **Veřejné subkorpusy** buď zadáním unikátního klíče, nebo podle příjmení autora subkorpusu (je třeba zadat alespoň 4 počáteční znaky). +Korpus je pak možné vyvolat v menu **Veřejné subkorpusy** buď zadáním unikátního klíče, nebo podle příjmení autora subkorpusu (je třeba zadat alespoň 4 počáteční znaky). 
  
 ===== Vyzkoušejte si na závěr ===== ===== Vyzkoušejte si na závěr =====