====== Morfologická značka (tag) ====== Morfologická značka (běžně nazývaná **tag**) je sumarizací gramatické informace o hledaném slovu ([[pojmy:pozice|pozici]]) v konkrétním kontextu. Možné tagy pro každý token se přiřazují na základě [[pojmy:morfologicka_analyza|morfologické analýzy]], výsledný tag je pak pro každý token vybrán během následné [[pojmy:desambiguace|desambiguace]]. Tagy jsou [[pojmy:atributy_pozicni|poziční atributy]]. Morfologická značka v českých korpusech ČNK je tvořena sekvencí značek (písmen a čísel), které mají specifický význam podle toho, na jaké pozici v kódu stojí. Ve větě //Po promoci na londýnské universitě odjel jsem roku 1878 do Netley na školení vojenských chirurgů.// má tvar //promoci// (přesto, že se potenciálně jedná o tvar morfologicky víceznačný) morfologickou značku ''%%NNFS6-----A----%%'', která o něm říká, že se jedná o * substantivum (=N) * běžné substantivum (=N) * femininum, tedy ženského rodu (=F) * singulár, tedy jednotné číslo (=S) * v šestém pádě, tedy lokálu (=6) Počínaje korpusem [[cnk:syn2020|SYN2020]] se anotuje i zvláštní značka gramatických kategorií slovesa [[pojmy:verbtag|verbtag]]. ===== Tagset ===== Soubor pravidel a hodnot, které se můžou vyskytovat v tagu, se nazývá tagset. Aktuální poziční [[seznamy:tagy#popis_jednotlivych_pozic_znacky|tagset užívaný v českých korpusech ČNK]] (dříve se používal tagset [[seznamy:tagy_archiv|jiný]]) má 15 pozic, každá z nich nese informaci o jiné gramatické kategorii: - Slovní druh - Detailní určení slovního druhu - Jmenný rod - Číslo - Pád - Přivlastňovací rod - Přivlastňovací číslo - Osoba - Čas - Stupeň - Negace - Aktivum/pasívum - Vid - //Nepoužito// - Varianta, stylový příznak apod. ===== Tagsety používané v paralelním korpusu InterCorp ===== Tagsety pro různé jazyky se různí. Jejich přehled naleznete [[cnk:intercorp:verze10#morfosyntakticka_anotace|zde]]. ==== Související odkazy ==== [[seznamy:tagy|Přehled morfologických značek]] • [[pojmy:morfologicka_analyza|Morfologická analýza]] • [[pojmy:atributy_pozicni|Poziční atributy]] • [[pojmy:verbtag|Verbtag]]