AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
pojmy:referencni [2013/06/26 17:03] – vytvořeno Václav Cvrčekpojmy:referencni [2021/01/16 22:41] (aktuální) – [Referenční korpus jako neměnná entita] Jan Křivan
Řádek 1: Řádek 1:
 ====== Referenční korpus ====== ====== Referenční korpus ======
  
-Referenční [[pojmy:korpus|korpus]] ja takový, který se od doby svého publikování nemění. Princip referenčnosti některých korpusů (např. [[cnk:syn2000|SYN2000]], [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zreplikovat výzkum cizí.+Termín //referenční [[pojmy:korpus|korpus]]// je používán minimálně ve dvou významech
  
-Referenční korpus tak zůstává neměnný i v případěže od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů. Aby bylo možné pracovat i s těmito korpusy v nejnovější verzi jejich anotace, byl vytvořen nereferenční korpus [[cnk:syn|SYN]], který vzniká sloučením všech referenčních korpusů zpracovaných nejnovějšími verzemi nástrojů.+  - pro entitu sloužící jako standard pro porovnání 
 +  - pro entitukterá je zpětně dostupná
  
-==== Související odkazy ====+První význam je obvyklý zejm. v publikacích, v nichž se pozornost soustředí na porovnávání textů či korpusů, druhý význam se vžil zejména v prostředí ČNK pro označování korpusů, jejichž podoba se v čase nemění.
  
-[[cnk:syn|Korpusy řady SYN]]+===== Referenční korpus jako standard ===== 
 + 
 +Při výzkumu, který je založen na porovnávání frekvencí jevů v různých korpusech (např. při zjišťování [[pojmy:keyword|klíčových slov]], viz aplikace [[manualy:kwords|KWords]]), se entita, s níž je zkoumaný text porovnáván, označuje za //referenční//. Na základě porovnání s referenčním korpusem, který slouží nejčastěji jako reprezentant běžného úzu, můžeme vyslovovat hypotézy o neobvykle vysoké (či naopak nízké) frekvenci jevu ve zkoumaném textu.  
 + 
 +Referenční korpus v tomto významu slouží jako svého druhu standard a ukazatel toho, co je obecně obvyklé. V důsledku toho se za referenční korpusy v tomto smyslu považují často korpusy, které jsou [[pojmy:reprezentativnost|reprezentativní]] a aspirují na zachycení obecného úzu (v protikladu ke korpusům specializovaným). 
 + 
 +===== Referenční korpus jako neměnná entita ===== 
 + 
 +Označení //referenční korpus// je v rámci ČNK užíváno pro takové korpusy, které se od doby svého publikování **nemění**. Princip referenčnosti některých korpusů (např. [[cnk:syn2005|SYN2005]], [[cnk:syn2010|SYN2010]], [[cnk:syn2015|SYN2015]], [[cnk:syn2020|SYN2020]]) umožňuje replikovatelnost výsledků. Tím, že se korpus i přes jeho neustálé zastarávání ponechává jako neměnná referenční entita, poskytuje badatelům příležitost opakovaně si ověřit vlastní výzkum nebo zopakovat výzkum cizí. Právě princip referenčnosti výzkumných dat je jedním z důležitých předpokladů posunující empirickou lingvistiku směrem k větší exaktnosti. Referenční korpus tak zůstává neměnný i v případě, že od doby jeho vzniku pokročil vývoj automatických nástrojů na [[pojmy:morfologicka_analyza|morfologické značkování]] a [[pojmy:lemma|lemmatizaci]] textů.  
 + 
 +Všechny korpusy zveřejněné ČNK po roce 2014 jsou bez výjimky referenční, a tedy zpětně dostupné. To se týká také korpusů bez vročení (např. [[cnk:syn|SYN]], [[cnk:diakorp|DIAKORP]], [[cnk:intercorp|InterCorp]]), jejichž nedílnou součástí se stalo číslo verze, která korpus jednoznačně identifikuje. Tyto korpusy jsou tedy [[pojmy:verzovany|verzované]], jejich jednotlivé verze jsou referenční a zajišťují tak plnou replikovatelnost výstupů. 
 + 
 +Na rozdíl od prvního významu termínu referenční korpus se tedy v rámci ustálené praxe ČNK tímto způsobem označují také korpusy, jejichž obsah se nemění, ale jsou svým složením specifické nebo specializované, např. [[cnk:syn2013pub|SYN2013PUB]]. 
 + 
 +==== Související odkazy ====
  
 +<WRAP round box 49%>
 +[[cnk:syn|Korpusy řady SYN]] • [[pojmy:reprezentativnost|Reprezentativnost korpusu]] • [[pojmy:verzovany|Verzovaný korpus]]
 +</WRAP>