Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:subkorpus [2013/06/28 12:31] – vaclavcvrcek | pojmy:subkorpus [2019/04/28 20:10] (aktuální) – [Subkorpus] vaclavcvrcek |
---|
====== Subkorpus ====== | ====== Subkorpus ====== |
| |
Subkorpus (někdy také virtuální korpus, nebo virtuální subkorpus) je podmnožina (zdrojového) korpusu, která je určena výčtem strukturních jednotek nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka ''[[pojmy:opus|<opus>]]''), dokumentu (''[[pojmy:doc|<doc>]]'') ale také vět (''[[pojmy:s|<s>]]''), příp. i dílem jediným. | Subkorpus (někdy také //virtuální korpus//, nebo //virtuální subkorpus//) je podmnožina (zdrojového) korpusu, která je určena výčtem strukturních jednotek nebo podmínkou, která tyto jednotky na základě strukturních atributů vymezuje. Subkorpus tak může být tvořen množinou děl (jednotka ''[[pojmy:opus|<opus>]]''), dokumentu (''[[pojmy:doc|<doc>]]'') ale také vět (''[[pojmy:s|<s>]]''), příp. i dílem jediným. |
| |
Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl (opusů), které ho tvoří. Na základě [[pojmy:atributy_strukturni|strukturních atributů]], které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná a přiměřená pro konkrétní typ výzkumné otázky. | Při vytváření subkorpusu vycházíme ze zdrojového korpusu a z jeho anotace děl (opusů), které ho tvoří. Na základě [[pojmy:atributy_strukturni|strukturních atributů]], které daný korpus obsahuje, můžeme vymezovat subkorpusy z děl určitého zaměření a dospět tak k reprezentativnosti, která je účelná a přiměřená pro konkrétní typ výzkumné otázky. |
| |
Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit korpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group="beletrie" />''), nebo děl a časopisů vydaných v letech 2007 a 2008 (podmínka ''<opus rokvyd=2007|2008" />''), případně subkorpus konkrétního autora (např. ''<opus autor="London, Jack" />''). Při formulování podmínek je možné využívat [[pojmy:regularni_vyrazy|regulární výrazy]] i další specifické vlastnosti [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]]. | Např. zdrojový korpus [[cnk:syn2010|SYN2010]] umožňuje vytvořit subkorpus pouze beletristických textů (podmínka by mohla být formulována např. ''<opus txtype_group=%%"beletrie"%% />''), nebo děl a časopisů vydaných v letech 2007 a 2008 (podmínka ''<opus rokvyd=%%"2007|2008"%% />''), případně subkorpus konkrétního autora (např. ''<opus autor=%%"London, Jack"%% />''). Při formulování podmínek je možné využívat [[pojmy:regularni_vyrazy|regulární výrazy]] i další specifické vlastnosti [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]]. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
[[pojmy:reprezentativnost|Reprezentativnost]] | <WRAP round box 52%> |
| [[pojmy:korpus|Korpus]] • [[pojmy:reprezentativnost|Reprezentativnost]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]] • [[kurz:subkorpusy|Vytváření subkorpusů]] |
[[pojmy:atributy_strukturni|Strukturní atributy]] | </WRAP> |
| |
[[pojmy:struktura_korpusu|Struktura korpusu]] | |