AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
kurz:subkorpusy [2018/08/08 12:23] vaclavcvrcekkurz:subkorpusy [2018/08/08 12:26] – [Smazání a přehled dostupných subkorpusů] vaclavcvrcek
Řádek 57: Řádek 57:
   * ''author=%%"Hrabal, Bohumil"%%'' – v subkorpusu budou obsaženy všechny texty, jejichž autorem je B. Hrabal (u vytváření podmínky obsahující jméno autora je vždy třeba dodržet tento konkrétní formát, případně autorovo jméno zkrátit, ale např. podmínka ''author=%%"Čapek.*"%%'' vztažená na velký korpus SYN by zahrnula texty nejen od obou bratrů Čapkových, ale též od méně známé bratrské dvojice [[http://www.databazeknih.cz/zivotopis/karel-jan-capek-4910|Karla Jana]] a [[http://www.databazeknih.cz/autori/michal-capek-10857|Michala]] Čapků)   * ''author=%%"Hrabal, Bohumil"%%'' – v subkorpusu budou obsaženy všechny texty, jejichž autorem je B. Hrabal (u vytváření podmínky obsahující jméno autora je vždy třeba dodržet tento konkrétní formát, případně autorovo jméno zkrátit, ale např. podmínka ''author=%%"Čapek.*"%%'' vztažená na velký korpus SYN by zahrnula texty nejen od obou bratrů Čapkových, ale též od méně známé bratrské dvojice [[http://www.databazeknih.cz/zivotopis/karel-jan-capek-4910|Karla Jana]] a [[http://www.databazeknih.cz/autori/michal-capek-10857|Michala]] Čapků)
   * ''genre=%%"BIO.*"%%'' – subkorpus zahrne všechny texty z oboru biologie    * ''genre=%%"BIO.*"%%'' – subkorpus zahrne všechny texty z oboru biologie 
-  * ''pubyear=%%"200[5-9]"%%'' – subkorpusu bude obsahovat všechny texty z let 2005 až 2009 +  * ''pubyear=%%"200[5-9]"%%'' – subkorpus bude obsahovat všechny texty z let 2005 až 2009 
  
 Podmínky lze i kombinovat, stejně jako [[kurz:pokrocile_dotazy#logicke_operatorykombinace_podminek_v_ramci_jedne_pozice|v rámci jedné pozice]], případně přidat další podmínku pomocí tlačítka + v modrém rámečku: Podmínky lze i kombinovat, stejně jako [[kurz:pokrocile_dotazy#logicke_operatorykombinace_podminek_v_ramci_jedne_pozice|v rámci jedné pozice]], případně přidat další podmínku pomocí tlačítka + v modrém rámečku:
  
-  * ''genre_group=%%"NAT.*"%% & medium=%%"TXB.*"%%'' – subkorpusu budou učební texty z oblasti přírodních věd +  * ''genre_group=%%"NAT.*"%% & medium=%%"TXB.*"%%'' – do subkorpusu budou zahrnuty učební texty z oblasti přírodních věd 
-  * ''txtype=%%"NOV.*"%% & srclang=%%"en.*"%% & pubyear=%%"2..."%% & authsex=%%"F.*"%%'' – v subkorpusu budou romány napsané ženami autorkami a přeložené z anglického originálu, které vyšly po roce 2000 (včetně)+  * ''txtype=%%"NOV.*"%% & srclang=%%"en.*"%% & pubyear=%%"2..."%% & authsex=%%"F.*"%%'' – subkorpus bude obsahovat romány napsané ženami a přeložené z anglického originálu, které vyšly po roce 2000 (včetně)
  
 V mluvených korpusech pak můžeme subkorpusy vytvářet např. podle pohlaví mluvčích či podle nářeční oblasti, odkud pocházejí. V rámci podmínky within vyberte strukturní jednotku **sp**, tedy mluvčí (//speaker//) a do prázdného políčka vyplňte konkrétní podmínku či kombinaci podmínek, např.: V mluvených korpusech pak můžeme subkorpusy vytvářet např. podle pohlaví mluvčích či podle nářeční oblasti, odkud pocházejí. V rámci podmínky within vyberte strukturní jednotku **sp**, tedy mluvčí (//speaker//) a do prázdného políčka vyplňte konkrétní podmínku či kombinaci podmínek, např.:
   * ''pohlavi=%%"Z"%% & oblast=%%"slezská"%%'' – v subkorpusu budou promluvy od žen ze slezské nářeční oblasti   * ''pohlavi=%%"Z"%% & oblast=%%"slezská"%%'' – v subkorpusu budou promluvy od žen ze slezské nářeční oblasti
-  * ''vzdelanityp=%%"VŠ"%% & oblast=%%"středočeská"%%'' – v subkorpusu budou promluvy vysokoškoláků ze středočeské oblasti+  * ''vzdelanityp=%%"VŠ"%% & oblast=%%"středočeská"%%'' – vznikne subkorpus promluv vysokoškoláků ze středočeské oblasti
  
 Pokud jste si oba subkorpusy vyzkoušeli vytvořit z korpusu ORAL2013, měl by první z nich mít velikost přes 180 tisíc pozic, zatímco ten druhý přes 441 tisíc. Pokud jste si oba subkorpusy vyzkoušeli vytvořit z korpusu ORAL2013, měl by první z nich mít velikost přes 180 tisíc pozic, zatímco ten druhý přes 441 tisíc.
Řádek 74: Řádek 74:
 ==== Smazání a přehled dostupných subkorpusů ==== ==== Smazání a přehled dostupných subkorpusů ====
  
-Subkorpusy můžeme spravovat a ty nepotřebné mazat v sekci **[[manualy:kontext:subkorpus#prehled_existujicich_subkorpusu|Mé subkorpusy]]**. +Subkorpusy můžeme spravovat a ty nepotřebné mazat v sekci **[[manualy:kontext:korpusy#prehled_existujicich_subkorpusu|Mé subkorpusy]]**. 
  
-[{{:kurz:smazatsubkorpus.png?| Mé subkorpusy – možnost smazání subkorpusu}}]+[{{:kurz:smazatsubkorpus.png?| Mé subkorpusy – možnost smazání subkorpusu FIXME}}]