Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:tag [2013/09/13 15:54] – Schvaleno pro 1. verzi vaclavcvrcek | pojmy:tag [2013/11/10 17:59] – [Tagset] lukasjanicik |
---|
Morfologická značka (běžně nazývaná **tag**) je sumarizací gramatické informace o hledaném slovu ([[pojmy:pozice|pozici]]) v konkrétním kontextu. Tag vzniká většinou automaticky na základě [[pojmy:morfologicka_analyza|morfologické analýzy]] a následné [[pojmy:desambiguace|desambiguace]]. | Morfologická značka (běžně nazývaná **tag**) je sumarizací gramatické informace o hledaném slovu ([[pojmy:pozice|pozici]]) v konkrétním kontextu. Tag vzniká většinou automaticky na základě [[pojmy:morfologicka_analyza|morfologické analýzy]] a následné [[pojmy:desambiguace|desambiguace]]. |
| |
Tagy v ČNK jsou poziční, to znamená, že morfologická značka je tvořena sekvencí značek (písmen a čísel), které mají specifický význam podle toho, na jaké pozici v kódu stojí. Ve větě //Po promoci na londýnské universitě odjel jsem roku 1878 do Netley na školení vojenských chirurgů.// má tvar //promoci// (přesto, že se potenciálně jedná o tvar morfologicky víceznačný) morfologickou značkou ''NNFS6-----A-----'', která o něm říká, že se jedná o | Tagy jsou [[pojmy:atributy_pozicni|poziční atributy]]. Morfologická značka v českých korpusech ČNK je tvořena sekvencí značek (písmen a čísel), které mají specifický význam podle toho, na jaké pozici v kódu stojí. Ve větě //Po promoci na londýnské universitě odjel jsem roku 1878 do Netley na školení vojenských chirurgů.// má tvar //promoci// (přesto, že se potenciálně jedná o tvar morfologicky víceznačný) morfologickou značku ''NNFS6-----A-----'', která o něm říká, že se jedná o |
* substantivum (=N) | * substantivum (=N) |
* běžné substantivum (=N) | * běžné substantivum (=N) |
* femininum (=F) | * femininum, tedy ženského rodu (=F) |
* singulár (=S) | * singulár, tedy jednotné číslo (=S) |
* v lokálu (=6) | * v šestém pádě, tedy lokálu (=6) |
| |
===== Tagset ===== | ===== Tagset ===== |
| |
Soubor pravidel a hodnot, které se můžou vyskytovat v tagu se nazývá tagset. Poziční [[seznamy:tagy|tagset užívaný v ČNK]] má 16 pozic, každá z nich nese informaci o jiné gramatické kategorii: | Soubor pravidel a hodnot, které se můžou vyskytovat v tagu se nazývá tagset. Poziční [[seznamy:tagy#popis_jednotlivych_pozic_znacky|tagset užívaný v českých korpusech ČNK]] má 16 pozic, každá z nich nese informaci o jiné gramatické kategorii: |
| |
- Slovní druh | - Slovní druh |
- Varianta, stylový příznak apod. | - Varianta, stylový příznak apod. |
- Vid | - Vid |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
<WRAP round box 49%> | |
| <WRAP round box 50%> |
[[seznamy:tagy|Přehled morfologických značek]] • [[pojmy:morfologicka_analyza|Morfologická analýza]] • [[pojmy:atributy_pozicni|Poziční atributy]] | [[seznamy:tagy|Přehled morfologických značek]] • [[pojmy:morfologicka_analyza|Morfologická analýza]] • [[pojmy:atributy_pozicni|Poziční atributy]] |
</WRAP> | </WRAP> |