Toto je starší verze dokumentu!
Anotace
Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní/segmentační údaje ( to je co?? segmentace není podle mě anotace a už vůbec to nejsou údaje!) a/nebo metalingvistické údaje [ spíš metatextové, ne?] k textovým datům korpusu. Lingvistickými údaji jsou například morfologické značky (tagy) přiřazované jednotlivým slovním tvarům, značky syntaktické, přiřazované slovním tvarům či jejich skupinám, nebo údaje sémantické, popř. další.
Při morfologické anotaci se danému slovnímu tvaru typicky přiřadí jeho lemma a hodnoty morfologických kategorií vč. slovního druhu (procesem morfologické analýzy, lemmatizace a morfologické desambiguace).
Vedle anotace, která se vztahuje k jednotlivým pozicím (slovům) v korpusu, existuje také anotace textů jako celků, které do korpusu vstupují. Tato anotace je pak přístupná k prohledávání ve formě strukturních atributů.
— V. Petkevič, V. Cvrček