Morfologická značka (běžně nazývaná tag) je sumarizací gramatické informace o hledaném slovu (pozici) v konkrétním kontextu. Možné tagy pro každý token se přiřazují na základě morfologické analýzy, výsledný tag je pak pro každý token vybrán během následné desambiguace.
Tagy jsou poziční atributy. Morfologická značka v českých korpusech ČNK je tvořena sekvencí značek (písmen a čísel), které mají specifický význam podle toho, na jaké pozici v kódu stojí. Ve větě Po promoci na londýnské universitě odjel jsem roku 1878 do Netley na školení vojenských chirurgů. má tvar promoci (přesto, že se potenciálně jedná o tvar morfologicky víceznačný) morfologickou značku NNFS6-----A----
, která o něm říká, že se jedná o
Počínaje korpusem SYN2020 se anotuje i zvláštní značka gramatických kategorií slovesa verbtag.
Soubor pravidel a hodnot, které se můžou vyskytovat v tagu, se nazývá tagset. Aktuální poziční tagset užívaný v českých korpusech ČNK (dříve se používal tagset jiný) má 15 pozic, každá z nich nese informaci o jiné gramatické kategorii:
Tagsety pro různé jazyky se různí. Jejich přehled naleznete zde.