AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:subkorpus [2013/06/28 12:30] vaclavcvrcekpojmy:subkorpus [2019/04/28 20:10] (aktuální) – [Subkorpus] vaclavcvrcek
Řádek 1: Řádek 1:
 ====== Subkorpus ====== ====== Subkorpus ======
  
-Subkorpus (někdy také virtuální korpus, nebo virtuální subkorpus) je podmnožina (zdrojového) korpusu, která je určena výčtem strukturních jednotek nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka ''[[pojmy:opus|<opus>]]''), dokumentu (''[[pojmy:doc|<doc>]]'') ale také vět (''[[pojmy:s|<s>]]''), příp. i dílem jediným.+Subkorpus (někdy také //virtuální korpus//, nebo //virtuální subkorpus//) je podmnožina (zdrojového) korpusu, která je určena výčtem strukturních jednotek nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka  ''[[pojmy:opus|<opus>]]''), dokumentu (''[[pojmy:doc|<doc>]]'') ale také vět (''[[pojmy:s|<s>]]''), příp. i dílem jediným.
  
 Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl (opusů), které ho tvoří. Na základě [[pojmy:atributy_strukturni|strukturních atributů]], které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná a přiměřená pro konkrétní typ výzkumné otázky. Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl (opusů), které ho tvoří. Na základě [[pojmy:atributy_strukturni|strukturních atributů]], které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná a přiměřená pro konkrétní typ výzkumné otázky.
  
-Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit korpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group="beletrie" />''), nebo děl a časopisů vydaných v roce 2007 (podmínka ''<opus rokvyd=2007" />''), případně subkorpus konkrétního autora (např. ''<opus autor="London, Jack" />'').+Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit subkorpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group=%%"beletrie"%% />''), nebo děl a časopisů vydaných v letech 2007 a 2008 (podmínka ''<opus rokvyd=%%"2007|2008"%% />''), případně subkorpus konkrétního autora (např. ''<opus autor=%%"London, Jack"%% />''). Při formulování podmínek je možné využívat [[pojmy:regularni_vyrazy|regulární výrazy]] i další specifické vlastnosti [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]].
  
 ==== Související odkazy ==== ==== Související odkazy ====
  
-[[pojmy:reprezentativnost|Reprezentativnost]] +<WRAP round box 52%> 
- +[[pojmy:korpus|Korpus]] • [[pojmy:reprezentativnost|Reprezentativnost]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]] • [[kurz:subkorpusy|Vytváření subkorpusů]] 
-[[pojmy:atributy_strukturni|Strukturní atributy]] +</WRAP>
- +
-[[pojmy:struktura_korpusu|Struktura korpusu]] +