Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
pojmy:referencni [2016/09/14 17:46]
Michal Křen
pojmy:referencni [2016/09/14 23:45] (aktuální)
Václav Cvrček [Referenční korpus jako neměnná entita]
Řádek 18: Řádek 18:
 Označení //​referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:​syn2005|SYN2005]],​ [[cnk:​syn2010|SYN2010]],​ [[cnk:​syn2015|SYN2015]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:​morfologicka_analyza|morfologické značkování]] a [[pojmy:​lemma|lemmatizaci]] textů. ​ Označení //​referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:​syn2005|SYN2005]],​ [[cnk:​syn2010|SYN2010]],​ [[cnk:​syn2015|SYN2015]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:​morfologicka_analyza|morfologické značkování]] a [[pojmy:​lemma|lemmatizaci]] textů. ​
  
-Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční,​ a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:​syn|SYN]],​ [[cnk:​diakorp|DIAKORP]],​ [[cnk:​intercorp|InterCorp]]),​ jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy sice [[pojmy:​verzovany|verzované]], ​ale jejich jednotlivé verze jsou referenční a zajišťují tak replikovatelnost výstupů.+Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční,​ a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:​syn|SYN]],​ [[cnk:​diakorp|DIAKORP]],​ [[cnk:​intercorp|InterCorp]]),​ jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy [[pojmy:​verzovany|verzované]],​ jejich jednotlivé verze jsou referenční a zajišťují tak plnou replikovatelnost výstupů.
  
 Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované,​ např. [[cnk:​syn2013pub|SYN2013PUB]]. Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované,​ např. [[cnk:​syn2013pub|SYN2013PUB]].