====== Subkorpus ====== Subkorpus (někdy také //virtuální korpus//, nebo //virtuální subkorpus//) je podmnožina (zdrojového) korpusu, která je určena výčtem strukturních jednotek nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka ''[[pojmy:opus|]]''), dokumentu (''[[pojmy:doc|]]'') ale také vět (''[[pojmy:s|]]''), příp. i dílem jediným. Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl (opusů), které ho tvoří. Na základě [[pojmy:atributy_strukturni|strukturních atributů]], které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná a přiměřená pro konkrétní typ výzkumné otázky. Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit subkorpus pouze beletristických textů (podmínka by mohla být formulována např. ''''), nebo děl a časopisů vydaných v letech 2007 a 2008 (podmínka ''''), případně subkorpus konkrétního autora (např. ''''). Při formulování podmínek je možné využívat [[pojmy:regularni_vyrazy|regulární výrazy]] i další specifické vlastnosti [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]]. ==== Související odkazy ==== [[pojmy:korpus|Korpus]] • [[pojmy:reprezentativnost|Reprezentativnost]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]] • [[kurz:subkorpusy|Vytváření subkorpusů]]