Syntaktická anotace použitá v některých korpusech ČNK (SYN2025, SYN2020 a SYN2015) vychází z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu (PDT). Základními atributy, do nichž je syntaktická analýza zakódována, jsou:
-
parent: relativní pozice tokenu, na němž je daný token závislý
eparent: pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý (přeskakuje předložky, spojky ap.)
-
-
prep: u jmen řízených předložkou uvádí lemma předložky
v korpusu SYN2025 také
ord a p_ord: pořadí slova ve větě a pořadí řídícího slova ve větě
v korpusu SYN2025 je také více atributů odvozených od atributu parent a eparent: p_pos, p_case, p_afun, p_verbtag; ep_pos, ep_case, ep_afun, ep_verbtag.
— Tomáš Jelínek