AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
kurz:subkorpusy [2018/08/08 12:21] – [Trvalý subkorpus pro pokročilé: vytvoření vlastnoručním stanovením podmínek] michalskrabalkurz:subkorpusy [2018/08/08 12:23] vaclavcvrcek
Řádek 27: Řádek 27:
 Každý korpus obsahuje vlastní sadu značek a zkratek zachycujících metainformace. Výše uvedený postup tak nelze použít např. pro SYN2010. Seznamy hodnot jednotlivých strukturních atributů včetně rozdílů mezi starší a novější verzí najdete v [[seznamy:index#zkratky_a_kody|sekci Seznamy]] na této wiki. Každý korpus obsahuje vlastní sadu značek a zkratek zachycujících metainformace. Výše uvedený postup tak nelze použít např. pro SYN2010. Seznamy hodnot jednotlivých strukturních atributů včetně rozdílů mezi starší a novější verzí najdete v [[seznamy:index#zkratky_a_kody|sekci Seznamy]] na této wiki.
 </WRAP> </WRAP>
 +
 +Pro jednorázovou specifikaci subkorpusu, na nějž chceme dotaz omezit, můžeme využít podmínku ''[[pojmy:within|within]]'' v rámci [[pojmy:cql|CQL]] dotazu: 
 +
 +  * Hledáme citoslovce u Karla Čapka (v nereferenčním korpusu SYN): ''[tag=%%"I.*"%%] within <opus autor=%%"Čapek, Karel"%% />''
 +
  
 ===== Vytvoření trvalého subkorpusu ===== ===== Vytvoření trvalého subkorpusu =====
Řádek 65: Řádek 70:
 Pokud jste si oba subkorpusy vyzkoušeli vytvořit z korpusu ORAL2013, měl by první z nich mít velikost přes 180 tisíc pozic, zatímco ten druhý přes 441 tisíc. Pokud jste si oba subkorpusy vyzkoušeli vytvořit z korpusu ORAL2013, měl by první z nich mít velikost přes 180 tisíc pozic, zatímco ten druhý přes 441 tisíc.
  
-Podmínku within lze používat i jednorázově při kladení dotazu, a to tak, že ji zapracujeme přímo do dotazu CQL:  
- 
-  * Hledáme citoslovce u Karla Čapka (v nereferenčním korpusu SYN): ''[tag=%%"I.*"%%] within <opus autor=%%"Čapek, Karel"%% />'' 
  
-Tento způsob hledání se více než permanentním subkorpusům podobá výběru textů pomocí metainformací (viz výše) a lze ho využít spíše při jednorázovém dotazování. 
  
 ==== Smazání a přehled dostupných subkorpusů ==== ==== Smazání a přehled dostupných subkorpusů ====