AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
pojmy:subkorpus [2013/06/28 12:27] – vytvořeno Václav Cvrčekpojmy:subkorpus [2019/04/28 20:10] (aktuální) – [Subkorpus] Václav Cvrček
Řádek 1: Řádek 1:
 ====== Subkorpus ====== ====== Subkorpus ======
  
-Subkorpus (někdy také virtuální korpus, nebo virtuální subkorpus) je podmnožina (zdrojového) korpusu, která je určena výčtem [[pojmy:atributy_strukturni|strukturních jednotek]] nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka ''<opus>''), dokumentu (''<doc>'') ale také vět (''<s>'').+Subkorpus (někdy také //virtuální korpus//, nebo //virtuální subkorpus//) je podmnožina (zdrojového) korpusu, která je určena výčtem strukturních jednotek nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka  ''[[pojmy:opus|<opus>]]''), dokumentu (''[[pojmy:doc|<doc>]]'') ale také vět (''[[pojmy:s|<s>]]''), příp. i dílem jediným.
  
-Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl, které ho tvoří. Na základě strukturních atributů, které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná pro konkrétní typ výzkumné otázky.+Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl (opusů), které ho tvoří. Na základě [[pojmy:atributy_strukturni|strukturních atributů]], které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná a přiměřená pro konkrétní typ výzkumné otázky.
  
-Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit korpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group="beletrie" />''), nebo děl a časopisů vydaných v roce 2007 (podmínka ''<opus rokvyd=2007" />''), případně subkorpus konkrétního autora (např. ''<opus autor="London, Jack" />'').+Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit subkorpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group=%%"beletrie"%% />''), nebo děl a časopisů vydaných v letech 2007 a 2008 (podmínka ''<opus rokvyd=%%"2007|2008"%% />''), případně subkorpus konkrétního autora (např. ''<opus autor=%%"London, Jack"%% />''). Při formulování podmínek je možné využívat [[pojmy:regularni_vyrazy|regulární výrazy]] i další specifické vlastnosti [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]].
  
 ==== Související odkazy ==== ==== Související odkazy ====
  
-[[pojmy:reprezentativnost|Reprezentativnost]] +<WRAP round box 52%> 
- +[[pojmy:korpus|Korpus]] • [[pojmy:reprezentativnost|Reprezentativnost]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]] • [[kurz:subkorpusy|Vytváření subkorpusů]] 
-[[pojmy:atributy_strukturni|Strukturní atributy]] +</WRAP>
- +
-[[pojmy:struktura_korpusu|Struktura korpusu]] +