Nastavení

Korpus LINK

LINK (původně LIngvistův Narozeniový Korpus, který byl vytvořen u příležitosti životního jubilea prof. Františka Čermáka) je korpus sestavený pouze z lingvistických textů. Jako takový je určen zejména pro výzkum specifik akademického jazyka (výzkum terminologie, jazyk lingvistiky apod.).

Korpus v současné době obsahuje cca 1,8 mil. textových slov. Korpus je lemmatizován a morfologicky označkován stejně jako jsou korpusy řady SYN, lemmatizace a značkování je zhruba na úrovni SYN2009PUB. Korpus LINK je sestaven z 256 odborných lingvistických textů z období let 1985–2010, velká většina textů je však z přelomu tisíciletí. Korpus je tvořen jak většími lingvistickými pracemi (monografie, sborníky), tak články v odborných časopisech (zejm. Slovo a slovesnost, Naše řeč).

Pro jednodušší práci s jednotlivými subtypy textů je korpus vedle standardní výbavy strukturních značek (txtype, genre, med apod.) opatřen i strukturní značkou disciplina, která rozděluje jednotlivé opusy do kategorií podle tradičních lingvistických disciplín:

  • drobnosti
  • etymologie
  • fonetika
  • kodifikace (a jazyková kultura)
  • kognitivní (lingvistika)
  • kontrastivní (lingvistika, popis)
  • korpus (a korpusová lingvistika)
  • kronika
  • lexikologie
  • morfologie
  • obecná (lingvistika)
  • onomastika
  • pragmatika
  • recenze
  • sociolingvistika
  • stylistika
  • syntax
  • toponomastika

Cvrček, V. – Kováříková, D. – Mácha, J. – Křen, M.: LINK: korpus odborných lingvistických textů, verze 2 z 6. 5. 2011. Ústav Českého národního korpusu FF UK, Praha 2011. Dostupný z WWW: http://www.korpus.cz