Toto je starší verze dokumentu!
Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun
Atributy afun, p_afun, ep_afun vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči (parent) či efektivnímu rodiči (eparent). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce.
Syntaktické funkce použité v korpusech SYN2015 a SYN2020 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu (PDT). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT).
Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci Obj, ne Pred.
V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na Anotační manuál PDT.
Afun | Definice | Poznámka |
---|---|---|
Pred | Predikát (přísudek) | pouze v hlavní větě |
Sb | Subjekt (podmět) | |
Obj | Objekt (předmět) | včetně určení činitele děje u opisného pasiva; vč. infinitivu u modálních a fázových sloves aj. |
Adv | Adverbiale (příslovečné určení) | bez dalšího rozlišení, vč. předložkových pádů u slovesa být, některých volných dativů aj. |
Atv | Doplněk | jen tzv. určující; technicky zavěšen na neslovesném členu |
AtvV | Doplněk | jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen) |
Atr | Atribut (přívlastek) | včetně spojení typu Jan Novák, genitivu po číslovkách aj. |
Pnom | Jmenná část verbonom. přísudku | se sponou být, bývat; mimo předložkové pády |
AuxV | Pomocné sloveso být | (Auxiliary Verb) |
Coord | Koordinační uzel | uzel, který reprezentuje souřadicí spojení: souřadicí spojka nebo interpunkce |
Apos | Aposice (hlavní uzel) | spojovací slovo nebo interpunkční znaménko |
AuxT | Zvratné se u refl. tantum | neoddělitelné se – reflexivní tantum |
AuxR | Zvratné se u pasiva | zvratné se, které není Obj ani AuxT (tvoří pasivum reflexivní) |
AuxP | Předložka | popř. všechny části složené předložky |
AuxC | Spojka podřadicí | |
AuxO | Nadbytečný element | odkazovací, emotivní element ap., např. etické ti |
AuxZ | Zdůrazňovací slovo | |
AuxX | Čárka | ne však nositel koordinace nebo koncový symbol |
AuxG | Jiné grafické symboly, které neukončují větu | |
AuxY | Příslovce a částice, které nelze zařadit jinam | |
AuxK | Koncová interpunkce věty | |
ExD | Součást aktuální elipsy | náhradní funkce pro technické hrany vedoucí místo od elidovaného členu k „pseudořídícímu“ slovu nebo pro hlavní člen věty bez predikátu (Ex-Dependent); také ve srovnávacích spojeních typu zdravý jako ryba |
Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu.
Frekvence syntaktických funkcí
Seznam značek a jejich frekvence v korpusu SYN2015.
Podle abecedy | Podle frekvence | ||
---|---|---|---|
Hodnota afun | Frekvence v korpusu SYN2015 | Hodnota afun | Frekvence v korpusu SYN2015 |
Adv | 13710363 | Atr | 24859249 |
AdvAtr | 74 | Adv | 13710363 |
AdvAtr_Ap | 14 | AuxP | 10794852 |
AdvAtr_Co | 309 | Obj | 10461705 |
Adv_Ap | 31288 | AuxK | 7837441 |
Adv_C | 39 | AuxX | 7007444 |
Adv_Co | 596299 | Sb | 6981795 |
Adv_Pa | 18158 | Coord | 4992966 |
Apos | 334041 | Pred | 4912302 |
Apos_Ap | 2440 | Pred_Co | 4860424 |
Apos_Co | 31269 | AuxG | 3402843 |
Apos_Pa | 262 | AuxC | 2522491 |
Atr | 24859249 | AuxT | 2497283 |
AtrAdv | 307 | Atr_Co | 2101018 |
AtrAdv_Ap | 72 | AuxZ | 1852858 |
AtrAdv_Co | 740 | ExD | 1747132 |
AtrAdv_Pa | 93 | Pnom | 1687985 |
AtrAtr | 34 | AuxV | 1668548 |
AtrAtr_Ap | 8 | Obj_Co | 1192756 |
AtrAtr_Co | 263 | Sb_Co | 956857 |
AtrAtr_Pa | 11 | ExD_Co | 911226 |
AtrObj | 57 | AuxY | 905768 |
AtrObj_Co | 229 | Adv_Co | 596299 |
Atr_Ap | 117568 | Coord_Co | 364706 |
Atr_Co | 2101018 | Apos | 334041 |
Atr_Pa | 19682 | ExD_Pa | 229260 |
Atv | 177471 | Atv | 177471 |
AtvV | 119332 | AuxR | 171594 |
AtvV_Ap | 73 | Sb_Ap | 146866 |
AtvV_Co | 705 | AtvV | 119332 |
AtvV_Pa | 90 | Atr_Ap | 117568 |
Atv_Ap | 254 | Pnom_Co | 111903 |
Atv_Co | 5077 | Obj_Ap | 94488 |
Atv_Pa | 265 | ExD_Ap | 87377 |
AuxC | 2522491 | Pred_Pa | 80484 |
AuxC_Ap | 2 | Coord_Ap | 55677 |
AuxC_Co | 60 | Coord_Pa | 41505 |
AuxC_Pa | 46 | Adv_Ap | 31288 |
AuxG | 3402843 | Apos_Co | 31269 |
AuxG_Ap | 14 | Pred_Ap | 20806 |
AuxG_Co | 330 | Atr_Pa | 19682 |
AuxG_Pa | 489 | Adv_Pa | 18158 |
AuxK | 7837441 | AuxO | 12422 |
AuxK_Pa | 67 | AuxY_Pa | 5539 |
AuxO | 12422 | Atv_Co | 5077 |
AuxP | 10794852 | Pnom_Ap | 2902 |
AuxP_Pa | 59 | Apos_Ap | 2440 |
AuxR | 171594 | AuxZ_Co | 790 |
AuxT | 2497283 | AtrAdv_Co | 740 |
AuxT_Pa | 12 | AtvV_Co | 705 |
AuxV | 1668548 | AuxG_Pa | 489 |
AuxV_Co | 67 | Obj_Pa | 379 |
AuxX | 7007444 | AuxG_Co | 330 |
AuxY | 905768 | AdvAtr_Co | 309 |
AuxY_Co | 7 | AtrAdv | 307 |
AuxY_Pa | 5539 | ObjAtr_Co | 271 |
AuxZ | 1852858 | Atv_Pa | 265 |
AuxZ_Co | 790 | AtrAtr_Co | 263 |
AuxZ_Pa | 251 | Apos_Pa | 262 |
Coord | 4992966 | Atv_Ap | 254 |
Coord_Ap | 55677 | AuxZ_Pa | 251 |
Coord_Co | 364706 | AtrObj_Co | 229 |
Coord_Pa | 41505 | Sb_Pa | 180 |
ExD | 1747132 | AtrAdv_Pa | 93 |
ExD_Ap | 87377 | AtvV_Pa | 90 |
ExD_Co | 911226 | AdvAtr | 74 |
ExD_Pa | 229260 | AtvV_Ap | 73 |
Obj | 10461705 | AtrAdv_Ap | 72 |
ObjAtr | 29 | AuxK_Pa | 67 |
ObjAtr_Co | 271 | AuxV_Co | 67 |
Obj_Ap | 94488 | AuxC_Co | 60 |
Obj_Co | 1192756 | AuxP_Pa | 59 |
Obj_Pa | 379 | AtrObj | 57 |
Pnom | 1687985 | AuxC_Pa | 46 |
Pnom_Ap | 2902 | Pnom_Pa | 41 |
Pnom_Co | 111903 | Adv_C | 39 |
Pnom_Pa | 41 | AtrAtr | 34 |
Pred | 4912302 | ObjAtr | 29 |
Pred_Ap | 20806 | AdvAtr_Ap | 14 |
Pred_Co | 4860424 | AuxG_Ap | 14 |
Pred_Pa | 80484 | AuxT_Pa | 12 |
Sb | 6981795 | AtrAtr_Pa | 11 |
Sb_Ap | 146866 | AtrAtr_Ap | 8 |
Sb_Co | 956857 | AuxY_Co | 7 |
Sb_Pa | 180 | AuxC_Ap | 2 |
— Tomáš Jelínek