Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
kurz:subkorpusy [2019/05/19 20:23]
Václav Cvrček [Jednorázové vyhledávání v určitém typu textů]
kurz:subkorpusy [2019/05/22 12:50] (aktuální)
Václav Cvrček [Trvalý subkorpus: vytvoření pomocí naklikání]
Řádek 42: Řádek 42:
  
   * 1. krok je vždy stejný: Musíme vybrat výchozí korpus, z něhož budeme volit odpovídající podmnožinu dat.   * 1. krok je vždy stejný: Musíme vybrat výchozí korpus, z něhož budeme volit odpovídající podmnožinu dat.
-  * 2. krok: V jednotlivých kolonkách strukturních typů zaškrtáme své volby příslušných kategorií. Čísla napravo od nich představují velikost textů v dané kategorii ​(vpravo nahoře lze přepínat mezi počty dokumentů či [[pojmy:​token|tokenů]]). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. Svou volbu můžeme upravovat pomocí tlačítek **Zúžit výběr** a **Zrušit výběr**. Je-li výběr dostatečně úzký, lze vybírat také přímo z konkrétních děl (**doc.title** v SYN2015, **opus.nazev** ve starších psaných korpusech).+  * 2. krok: V jednotlivých kolonkách strukturních typů zaškrtáme své volby příslušných kategorií. Čísla napravo od nich představují velikost textů v dané kategorii ​počtu [[pojmy:​token|tokenů]]. Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. Svou volbu můžeme upravovat pomocí tlačítek **Zúžit výběr** a **Zrušit výběr**. Je-li výběr dostatečně úzký, lze vybírat také přímo z konkrétních děl (**doc.title** v SYN2015, **opus.nazev** ve starších psaných korpusech).
   * 3. krok: Subkorpusu je potřeba přidělit jméno (tj. jednoznačný a jedinečný identifikátor,​ který v rámci seznamu vašich existujících subkorpusů vytvořených z daného zdrojového korpusu dosud nebyl použit).   * 3. krok: Subkorpusu je potřeba přidělit jméno (tj. jednoznačný a jedinečný identifikátor,​ který v rámci seznamu vašich existujících subkorpusů vytvořených z daného zdrojového korpusu dosud nebyl použit).