Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:referencni [2015/06/19 11:40] – Dva vyznamy vaclavcvrcek | pojmy:referencni [2021/01/16 22:41] (aktuální) – [Referenční korpus jako neměnná entita] jankrivan |
---|
===== Referenční korpus jako neměnná entita ===== | ===== Referenční korpus jako neměnná entita ===== |
| |
Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2000|SYN2000]], [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. | Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]], [[cnk:syn2020|SYN2020]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. |
| |
Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. | Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy [[pojmy:verzovany|verzované]], jejich jednotlivé verze jsou referenční a zajišťují tak plnou replikovatelnost výstupů. |
| |
Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované. | Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované, např. [[cnk:syn2013pub|SYN2013PUB]]. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
<WRAP round box 49%> | <WRAP round box 49%> |
[[cnk:syn|Korpusy řady SYN]] • [[pojmy:reprezentativnost|Reprezentativnost korpusu]] | [[cnk:syn|Korpusy řady SYN]] • [[pojmy:reprezentativnost|Reprezentativnost korpusu]] • [[pojmy:verzovany|Verzovaný korpus]] |
</WRAP> | </WRAP> |