Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
cnk:link [2015/01/23 16:14]
Václav Cvrček
cnk:link [2015/04/13 11:45] (aktuální)
Václav Cvrček
Řádek 5: Řádek 5:
 **LINK** (původně **LI**ngvistův **N**arozeniový **K**orpus, který byl vytvořen u příležitosti životního jubilea prof. Františka Čermáka) je korpus sestavený pouze z lingvistických textů. Jako takový je určen zejména pro výzkum specifik akademického jazyka (výzkum terminologie,​ jazyk lingvistiky apod.). **LINK** (původně **LI**ngvistův **N**arozeniový **K**orpus, který byl vytvořen u příležitosti životního jubilea prof. Františka Čermáka) je korpus sestavený pouze z lingvistických textů. Jako takový je určen zejména pro výzkum specifik akademického jazyka (výzkum terminologie,​ jazyk lingvistiky apod.).
  
-Korpus v současné době obsahuje cca 1,8 mil. textových slov. Korpus je [[pojmy:​lemma#​lemmatizace|lemmatizován]] a [[pojmy:​morfologicka_analyza|morfologicky označkován]] stejně jako jsou korpusy řady [[cnk:​syn|SYN]],​ lemmatizace a značkování je zhruba na úrovni [[cnk:​syn2009pub|SYN2009PUB]]. Korpus LINK je sestaven z 256 odborných lingvistických textů z období let 1985 - 2010, velká většina textů je však z přelomu tisíciletí. Korpus je tvořen jak většími lingvistickými pracemi (monografie,​ sborníky), tak články v odborných časopisech (zejm. Slovo a slovesnost, Naše řeč).+Korpus v současné době obsahuje cca 1,8 mil. textových slov. Korpus je [[pojmy:​lemma#​lemmatizace|lemmatizován]] a [[pojmy:​morfologicka_analyza|morfologicky označkován]] stejně jako jsou korpusy řady [[cnk:​syn|SYN]],​ lemmatizace a značkování je zhruba na úrovni [[cnk:​syn2009pub|SYN2009PUB]]. Korpus LINK je sestaven z 256 odborných lingvistických textů z období let 1985--2010, velká většina textů je však z přelomu tisíciletí. Korpus je tvořen jak většími lingvistickými pracemi (monografie,​ sborníky), tak články v odborných časopisech (zejm. Slovo a slovesnost, Naše řeč).
  
 Pro jednodušší práci s jednotlivými subtypy textů je korpus vedle standardní výbavy [[pojmy:​atributy_strukturni|strukturních značek]] (txtype, genre, med apod.) opatřen i strukturní značkou disciplina, která rozděluje jednotlivé [[pojmy:​opus|opusy]] do kategorií podle tradičních lingvistických disciplín: Pro jednodušší práci s jednotlivými subtypy textů je korpus vedle standardní výbavy [[pojmy:​atributy_strukturni|strukturních značek]] (txtype, genre, med apod.) opatřen i strukturní značkou disciplina, která rozděluje jednotlivé [[pojmy:​opus|opusy]] do kategorií podle tradičních lingvistických disciplín: