Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:referencni [2016/09/14 17:46] – michalkren | pojmy:referencni [2021/01/16 22:41] (aktuální) – [Referenční korpus jako neměnná entita] jankrivan |
---|
===== Referenční korpus jako neměnná entita ===== | ===== Referenční korpus jako neměnná entita ===== |
| |
Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. | Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]], [[cnk:syn2020|SYN2020]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. |
| |
Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy sice [[pojmy:verzovany|verzované]], ale jejich jednotlivé verze jsou referenční a zajišťují tak replikovatelnost výstupů. | Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy [[pojmy:verzovany|verzované]], jejich jednotlivé verze jsou referenční a zajišťují tak plnou replikovatelnost výstupů. |
| |
Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované, např. [[cnk:syn2013pub|SYN2013PUB]]. | Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované, např. [[cnk:syn2013pub|SYN2013PUB]]. |