Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:subkorpus [2013/06/28 12:28] – vaclavcvrcek | pojmy:subkorpus [2019/04/28 20:10] (aktuální) – [Subkorpus] vaclavcvrcek |
---|
====== Subkorpus ====== | ====== Subkorpus ====== |
| |
Subkorpus (někdy také virtuální korpus, nebo virtuální subkorpus) je podmnožina (zdrojového) korpusu, která je určena výčtem [[pojmy:atributy_strukturni|strukturních jednotek]] nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka ''<opus>''), dokumentu (''<doc>'') ale také vět (''<s>''), příp. i dílem jediným. | Subkorpus (někdy také //virtuální korpus//, nebo //virtuální subkorpus//) je podmnožina (zdrojového) korpusu, která je určena výčtem strukturních jednotek nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka ''[[pojmy:opus|<opus>]]''), dokumentu (''[[pojmy:doc|<doc>]]'') ale také vět (''[[pojmy:s|<s>]]''), příp. i dílem jediným. |
| |
Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl, které ho tvoří. Na základě strukturních atributů, které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná pro konkrétní typ výzkumné otázky. | Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl (opusů), které ho tvoří. Na základě [[pojmy:atributy_strukturni|strukturních atributů]], které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná a přiměřená pro konkrétní typ výzkumné otázky. |
| |
Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit korpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group="beletrie" />''), nebo děl a časopisů vydaných v roce 2007 (podmínka ''<opus rokvyd=2007" />''), případně subkorpus konkrétního autora (např. ''<opus autor="London, Jack" />''). | Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit subkorpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group=%%"beletrie"%% />''), nebo děl a časopisů vydaných v letech 2007 a 2008 (podmínka ''<opus rokvyd=%%"2007|2008"%% />''), případně subkorpus konkrétního autora (např. ''<opus autor=%%"London, Jack"%% />''). Při formulování podmínek je možné využívat [[pojmy:regularni_vyrazy|regulární výrazy]] i další specifické vlastnosti [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]]. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
[[pojmy:reprezentativnost|Reprezentativnost]] | <WRAP round box 52%> |
| [[pojmy:korpus|Korpus]] • [[pojmy:reprezentativnost|Reprezentativnost]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]] • [[kurz:subkorpusy|Vytváření subkorpusů]] |
[[pojmy:atributy_strukturni|Strukturní atributy]] | </WRAP> |
| |
[[pojmy:struktura_korpusu|Struktura korpusu]] | |