Skrýt
Nastavení

Syntaktické značky

Syntaktická anotace použitá v některých korpusech ČNK (např. v SYN2015) vychází z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu (PDT). Základními atributy, do nichž je syntaktická analýza zakódována, jsou:

  • afun, p_afun, ep_afun: u každého tokenu uvádí syntaktickou funkci podle analytické roviny PDT
  • parent: relativní pozice tokenu, na němž je daný token závislý
  • eparent: pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý (přeskakuje předložky, spojky ap.)
  • p_tag, p_lemma: tag a lemma řídícího tokenu
  • ep_tag, ep_lemma: totéž jako p_tag a p_lemma, ale pouze u autosémantických slov
  • prep: u jmen řízených předložkou uvádí lemma předložky

Tomáš Jelínek