Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
kurz:subkorpusy [2021/04/26 10:20] – [Jednorázové vyhledávání v určitém typu textů] vaclavcvrcek | kurz:subkorpusy [2021/04/26 14:41] (aktuální) – [Veřejné subkorpusy] michalskrabal |
---|
Pro jednorázovou specifikaci subkorpusu, na nějž chceme dotaz omezit, můžeme využít podmínku ''[[pojmy:within|within]]'' v rámci [[pojmy:cql|CQL]] dotazu: | Pro jednorázovou specifikaci subkorpusu, na nějž chceme dotaz omezit, můžeme využít podmínku ''[[pojmy:within|within]]'' v rámci [[pojmy:cql|CQL]] dotazu: |
| |
* Hledáme citoslovce u Karla Čapka (v nereferenčním korpusu [[cnk:syn:verze7|SYN, verze 7]]): ''[tag=%%"I.*"%%] within <doc author=%%"Čapek, Karel"%% />'' | * Hledáme citoslovce u Karla Čapka (v nereferenčním korpusu [[cnk:syn:verze8|SYN, verze 8]]): ''[tag=%%"I.*"%%] within <doc author=%%"Čapek, Karel"%% />'' |
| |
| |
Specifický subkorpus můžeme vytvořit i pomocí podmínky [[pojmy:within|within]], o níž jsme mluvili v rámci [[kurz:pokrocile_dotazy#hledani_v_ramci_jedne_vety|lekce o CQL]]. Výhodou této složitější cesty je to, že můžeme pracovat s celou škálou informací, které nám korpusový materiál nabízí, nevýhodou je její náročnost (je třeba znát jak struktury v různých korpusech, tak jednotlivé atributy i jejich hodnoty a konkrétní formát). | Specifický subkorpus můžeme vytvořit i pomocí podmínky [[pojmy:within|within]], o níž jsme mluvili v rámci [[kurz:pokrocile_dotazy#hledani_v_ramci_jedne_vety|lekce o CQL]]. Výhodou této složitější cesty je to, že můžeme pracovat s celou škálou informací, které nám korpusový materiál nabízí, nevýhodou je její náročnost (je třeba znát jak struktury v různých korpusech, tak jednotlivé atributy i jejich hodnoty a konkrétní formát). |
| |
V menu vyberte položku **Korpusy → Vytvořit nový subkorpus**. Na zobrazené stránce nejprve zvolte korpus, z něhož chcete texty vybírat (u psaných korpusů nejčastěji [[cnk:syn2015|SYN2015]] či daleko rozsáhlejší [[cnk:syn|SYN]]), a svůj nový subkorpus nezapomeňte pojmenovat. Poté zvolte možnost Specifikovat subkorpus pomocí volby: **Vlastní within podmínka**. To umožní vybrat do subkorpusu texty (v psaných korpusech) či např. mluvčí (v mluvených korpusech) odpovídající konkrétním podmínkám. V psaných korpusech se obvykle vybírají texty, tzv. **opusy** či struktury typu **doc**. Do prázdného políčka je třeba vyplnit konkrétní podmínku. Následující příklady pocházejí z korpusu SYN2015: | V menu vyberte položku **Korpusy → Vytvořit nový subkorpus**. Na zobrazené stránce nejprve zvolte korpus, z něhož chcete texty vybírat (u psaných korpusů nejčastěji [[cnk:syn2020|SYN2020]] či daleko rozsáhlejší [[cnk:syn|SYN]]), a svůj nový subkorpus nezapomeňte pojmenovat. Poté zvolte možnost Specifikovat subkorpus pomocí volby: **Vlastní within podmínka**. To umožní vybrat do subkorpusu texty (v psaných korpusech) či např. mluvčí (v mluvených korpusech) odpovídající konkrétním podmínkám. V psaných korpusech se obvykle vybírají texty, tzv. **opusy** či struktury typu **doc**. Do prázdného políčka je třeba vyplnit konkrétní podmínku. Následující příklady pocházejí z korpusu SYN2020: |
| |
* ''txtype_group=%%"FIC.*"%%'' – v subkorpusu budou obsaženy všechny beletristické texty z původního korpusu | * ''txtype_group=%%"FIC.*"%%'' – v subkorpusu budou obsaženy všechny beletristické texty z původního korpusu |
* ''author=%%"Hrabal, Bohumil"%%'' – v subkorpusu budou obsaženy všechny texty, jejichž autorem je B. Hrabal (u vytváření podmínky obsahující jméno autora je vždy třeba dodržet tento konkrétní formát, případně autorovo jméno zkrátit, ale např. podmínka ''author=%%"Čapek.*"%%'' vztažená na velký korpus SYN by zahrnula texty nejen od obou bratrů Čapkových, ale též od méně známé bratrské dvojice [[http://www.databazeknih.cz/zivotopis/karel-jan-capek-4910|Karla Jana]] a [[http://www.databazeknih.cz/autori/michal-capek-10857|Michala]] Čapků) | * ''author=%%"Soukupová, Petra"%%'' – v subkorpusu budou obsaženy všechny texty, jejichž autorkou je P. Soukupová (u vytváření podmínky obsahující jméno autora je vždy třeba dodržet tento konkrétní formát, případně autorovo jméno zkrátit, ale např. podmínka ''author=%%"Čapek.*"%%'' vztažená na velký korpus SYN by zahrnula texty nejen od obou bratrů Čapkových, ale též od méně známé bratrské dvojice [[http://www.databazeknih.cz/zivotopis/karel-jan-capek-4910|Karla Jana]] a [[http://www.databazeknih.cz/autori/michal-capek-10857|Michala]] Čapků) |
* ''genre=%%"BIO.*"%%'' – subkorpus zahrne všechny texty z oboru biologie | * ''genre=%%"BIO.*"%%'' – subkorpus zahrne všechny texty z oboru biologie |
* ''pubyear=%%"200[5-9]"%%'' – subkorpus bude obsahovat všechny texty z let 2005 až 2009 | * ''pubyear=%%"200[5-9]"%%'' – subkorpus bude obsahovat všechny texty z let 2005 až 2009 |
Unikátní klíč lze zobrazit, pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku drobečkové navigace pod logem KonText). | Unikátní klíč lze zobrazit, pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku drobečkové navigace pod logem KonText). |
| |
Korpus je pak možné vyvolat v měnu **Veřejné subkorpusy** buď zadáním unikátního klíče, nebo podle příjmení autora subkorpusu (je třeba zadat alespoň 4 počáteční znaky). | Korpus je pak možné vyvolat v menu **Veřejné subkorpusy** buď zadáním unikátního klíče, nebo podle příjmení autora subkorpusu (je třeba zadat alespoň 4 počáteční znaky). |
| |
===== Vyzkoušejte si na závěr ===== | ===== Vyzkoušejte si na závěr ===== |