Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
pojmy:referencni [2016/09/14 23:45]
Václav Cvrček [Referenční korpus jako neměnná entita]
pojmy:referencni [2021/01/16 22:41] (aktuální)
Jan Křivan [Referenční korpus jako neměnná entita]
Řádek 16: Řádek 16:
 ===== Referenční korpus jako neměnná entita ===== ===== Referenční korpus jako neměnná entita =====
  
-Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. +Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]], [[cnk:syn2020|SYN2020]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. 
  
 Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy [[pojmy:verzovany|verzované]], jejich jednotlivé verze jsou referenční a zajišťují tak plnou replikovatelnost výstupů. Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy [[pojmy:verzovany|verzované]], jejich jednotlivé verze jsou referenční a zajišťují tak plnou replikovatelnost výstupů.