Toto je starší verze dokumentu!
Syntaktické značky
Syntaktická anotace použitá v některých korpusech ČNK (např. v SYN2015) vychází z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu (PDT). Základními atributy, do nichž je syntaktická analýza zakódována, jsou:
- afun, p_afun, ep_afun: u každého tokenu uvádí syntaktickou funkci podle analytické roviny PDT
- parent: relativní pozice tokenu, na němž je daný token závislý
- eparent: pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý (přeskakuje předložky, spojky ap.)
- p_tag, p_lemma: tag a lemma řídícího tokenu
- ep_tag, ep_lemma: totéž jako
p_tag
ap_lemma
, ale pouze u autosémantických slov - prep: u jmen řízených předložkou uvádí lemma předložky
— Tomáš Jelínek