AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
pojmy:referencni [2016/09/14 16:39] – [Referenční korpus jako neměnná entita] Michal Křenpojmy:referencni [2016/09/14 17:46] Michal Křen
Řádek 18: Řádek 18:
 Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů.  Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. 
  
-Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy sice **verzované**, ale jejich jednotlivé verze jsou referenční a zajišťují tak replikovatelnost výstupů. Uvádění čísla verze (např. [[cnk:syn:verze3|SYN verze 3]], [[cnk:diakorp|DIAKORP verze 6]], [[cnk:intercorp:verze8|InterCorp verze 8]] apod.) proto patří u těchto korpusů k dobré citační praxi.+Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy sice [[pojmy:verzovany|verzované]], ale jejich jednotlivé verze jsou referenční a zajišťují tak replikovatelnost výstupů.
  
 Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované, např. [[cnk:syn2013pub|SYN2013PUB]]. Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované, např. [[cnk:syn2013pub|SYN2013PUB]].
Řádek 25: Řádek 25:
  
 <WRAP round box 49%> <WRAP round box 49%>
-[[cnk:syn|Korpusy řady SYN]] • [[pojmy:reprezentativnost|Reprezentativnost korpusu]]+[[cnk:syn|Korpusy řady SYN]] • [[pojmy:reprezentativnost|Reprezentativnost korpusu]] • [[pojmy:verzovany|Verzovaný korpus]]
 </WRAP> </WRAP>