AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
seznamy:syntakticke_znacky [2015/12/10 21:25] – vytvořeno Václav Cvrčekseznamy:syntakticke_znacky [2016/10/17 13:04] (aktuální) Michal Křen
Řádek 1: Řádek 1:
-====== Syntaktické značky (atributy: afun, p_afun a ep_afun) ======+====== Syntaktické značky ======
  
-Seznam značek jejich význam.+[[pojmy:syntakticka_analyza|Syntaktická anotace]] použitá v některých korpusech ČNK (např. v [[cnk:syn2015|SYN2015]]) vychází z koncepce anotace na tzv. analytické rovině [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Pražského závislostního korpusu]] (PDT). Základními atributy, do nichž je syntaktická analýza zakódována, jsou: 
 +  * [[seznamy:afun|afun, p_afun, ep_afun]]: u každého tokenu uvádí syntaktickou funkci podle [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|analytické roviny PDT]] 
 +  * [[seznamy:parent|parent]]: relativní pozice tokenu, na němž je daný token závislý 
 +  * [[seznamy:eparent|eparent]]: pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý (přeskakuje předložky, spojky ap.) 
 +  * [[seznamy:p_tag|p_tag, p_lemma]]: tag a lemma řídícího tokenu  
 +  * [[seznamy:p_tag|ep_tag, ep_lemma]]: totéž jako ''p_tag'' a ''p_lemma'', ale pouze u autosémantických slov  
 +  * [[seznamy:prep|prep]]: u jmen řízených předložkou uvádí lemma předložky
  
-^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ + --- //Tomáš Jelínek//
-| Atr | 24859249 | +
-| Adv | 13710363 | +
-| AuxP | 10794852 | +
-| Obj | 10461705 | +
-| AuxK | 7837441 | +
-| AuxX | 7007444 | +
-| Sb | 6981795 | +
-| Coord | 4992966 | +
-| Pred | 4912302 | +
-| Pred_Co | 4860424 | +
-| AuxG | 3402843 | +
-| AuxC | 2522491 | +
-| AuxT | 2497283 | +
-| Atr_Co | 2101018 | +
-| AuxZ | 1852858 | +
-| ExD | 1747132 | +
-| Pnom | 1687985 | +
-| AuxV | 1668548 | +
-| Obj_Co | 1192756 | +
-| Sb_Co | 956857 | +
-| ExD_Co | 911226 | +
-| AuxY | 905768 | +
-| Adv_Co | 596299 | +
-| Coord_Co | 364706 | +
-| Apos | 334041 | +
-| ExD_Pa | 229260 | +
-| Atv | 177471 | +
-| AuxR | 171594 | +
-| Sb_Ap | 146866 | +
-| AtvV | 119332 | +
-| Atr_Ap | 117568 | +
-| Pnom_Co | 111903 | +
-| Obj_Ap | 94488 | +
-| ExD_Ap | 87377 | +
-| Pred_Pa | 80484 | +
-| Coord_Ap | 55677 | +
-| Coord_Pa | 41505 | +
-| Adv_Ap | 31288 | +
-| Apos_Co | 31269 | +
-| Pred_Ap | 20806 | +
-| Atr_Pa | 19682 | +
-| Adv_Pa | 18158 | +
-| AuxO | 12422 | +
-| AuxY_Pa | 5539 | +
-| Atv_Co | 5077 | +
-| Pnom_Ap | 2902 | +
-| Apos_Ap | 2440 | +
-| AuxZ_Co | 790 | +
-| AtrAdv_Co | 740 | +
-| AtvV_Co | 705 | +
-| AuxG_Pa | 489 | +
-| Obj_Pa | 379 | +
-| AuxG_Co | 330 | +
-| AdvAtr_Co | 309 | +
-| AtrAdv | 307 | +
-| ObjAtr_Co | 271 | +
-| Atv_Pa | 265 | +
-| AtrAtr_Co | 263 | +
-| Apos_Pa | 262 | +
-| Atv_Ap | 254 | +
-| AuxZ_Pa | 251 | +
-| AtrObj_Co | 229 | +
-| Sb_Pa | 180 | +
-| AtrAdv_Pa | 93 | +
-| AtvV_Pa | 90 | +
-| AdvAtr | 74 | +
-| AtvV_Ap | 73 | +
-| AtrAdv_Ap | 72 | +
-| AuxV_Co | 67 | +
-| AuxK_Pa | 67 | +
-| AuxC_Co | 60 | +
-| AuxP_Pa | 59 | +
-| AtrObj | 57 | +
-| AuxC_Pa | 46 | +
-| Pnom_Pa | 41 | +
-| Adv_C | 39 | +
-| AtrAtr | 34 | +
-| ObjAtr | 29 | +
-| AuxG_Ap | 14 | +
-| AdvAtr_Ap | 14 | +
-| AuxT_Pa | 12 | +
-| AtrAtr_Pa | 11 | +
-| AtrAtr_Ap | 8 | +
-| AuxY_Co | 7 | +
-| AuxC_Ap | 2 |+