AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Referenční korpus

Referenční korpus je takový, který se od doby svého publikování nemění. Princip referenčnosti některých korpusů (např. SYN2000, SYN2005, SYN2010) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti.

Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na morfologické značkování a lemmatizaci textů. Aby bylo možné pracovat s referenčními korpusy řady SYN v nejnovější verzi jejich anotace, byl vytvořen nereferenční korpus SYN, který vzniká sloučením všech těchto korpusů a jejich zpracováním nejnovějšími verzemi nástrojů.

Související odkazy