Nastavení

Toto je starší verze dokumentu!


Anotace

Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní/segmentační údaje (FIXME to je co?? segmentace není podle mě anotace a už vůbec to nejsou údaje!) a/nebo metalingvistické údaje [FIXME spíš metatextové, ne?] k textovým datům korpusu. Lingvistickými údaji jsou například morfologické značky (tagy) přiřazované jednotlivým slovním tvarům, značky syntaktické, přiřazované slovním tvarům či jejich skupinám, nebo údaje sémantické, popř. další.

Při morfologické anotaci se danému slovnímu tvaru typicky přiřadí jeho lemma a hodnoty morfologických kategorií vč. slovního druhu (procesem morfologické analýzy, lemmatizace a morfologické desambiguace).

Vedle anotace, která se vztahuje k jednotlivým pozicím (slovům) v korpusu, existuje také anotace textů jako celků, které do textu vstupují. Tato anotace je pak přístupná k prohledávání ve formě strukturních atributů.

V. Petkevič, V. Cvrček

Související odkazy