AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun

Atributy afun, p_afun, ep_afun vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči (parent) či efektivnímu rodiči (eparent). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce.

Syntaktické funkce použité v korpusech SYN2015 a SYN2020 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu (PDT). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT).

Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci Obj, ne Pred.

V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na Anotační manuál PDT.

Afun Definice Poznámka
Pred Predikát (přísudek) pouze v hlavní větě
Sb Subjekt (podmět)
Obj Objekt (předmět) včetně určení činitele děje u opisného pasiva; vč. infinitivu u modálních a fázových sloves aj.
Adv Adverbiale (příslovečné určení) bez dalšího rozlišení, vč. předložkových pádů u slovesa být, některých volných dativů aj.
Atv Doplněk jen tzv. určující; technicky zavěšen na neslovesném členu
AtvV Doplněk jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen)
Atr Atribut (přívlastek) včetně spojení typu Jan Novák, genitivu po číslovkách aj.
Pnom Jmenná část verbonom. přísudku se sponou být, bývat; mimo předložkové pády
AuxV Pomocné sloveso být (Auxiliary Verb)
Coord Koordinační uzel uzel, který reprezentuje souřadicí spojení: souřadicí spojka nebo interpunkce
Apos Aposice (hlavní uzel) spojovací slovo nebo interpunkční znaménko
AuxT Zvratné se u refl. tantum neoddělitelné se – reflexivní tantum
AuxR Zvratné se u pasiva zvratné se, které není Obj ani AuxT (tvoří pasivum reflexivní)
AuxP Předložka popř. všechny části složené předložky
AuxC Spojka podřadicí
AuxO Nadbytečný element odkazovací, emotivní element ap., např. etické ti
AuxZ Zdůrazňovací slovo
AuxX Čárka ne však nositel koordinace nebo koncový symbol
AuxG Jiné grafické symboly, které neukončují větu
AuxY Příslovce a částice, které nelze zařadit jinam
AuxK Koncová interpunkce věty
ExD Součást aktuální elipsy náhradní funkce pro technické hrany vedoucí místo od elidovaného členu k „pseudořídícímu“ slovu nebo pro hlavní člen věty bez predikátu (Ex-Dependent); také ve srovnávacích spojeních typu zdravý jako ryba

Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu.

Frekvence syntaktických funkcí

Seznam značek a jejich frekvence v korpusu SYN2015.

Podle abecedy Podle frekvence
Hodnota afun Frekvence v korpusu SYN2015 Hodnota afun Frekvence v korpusu SYN2015
Adv 13710363 Atr 24859249
AdvAtr 74 Adv 13710363
AdvAtr_Ap 14 AuxP 10794852
AdvAtr_Co 309 Obj 10461705
Adv_Ap 31288 AuxK 7837441
Adv_C 39 AuxX 7007444
Adv_Co 596299 Sb 6981795
Adv_Pa 18158 Coord 4992966
Apos 334041 Pred 4912302
Apos_Ap 2440 Pred_Co 4860424
Apos_Co 31269 AuxG 3402843
Apos_Pa 262 AuxC 2522491
Atr 24859249 AuxT 2497283
AtrAdv 307 Atr_Co 2101018
AtrAdv_Ap 72 AuxZ 1852858
AtrAdv_Co 740 ExD 1747132
AtrAdv_Pa 93 Pnom 1687985
AtrAtr 34 AuxV 1668548
AtrAtr_Ap 8 Obj_Co 1192756
AtrAtr_Co 263 Sb_Co 956857
AtrAtr_Pa 11 ExD_Co 911226
AtrObj 57 AuxY 905768
AtrObj_Co 229 Adv_Co 596299
Atr_Ap 117568 Coord_Co 364706
Atr_Co 2101018 Apos 334041
Atr_Pa 19682 ExD_Pa 229260
Atv 177471 Atv 177471
AtvV 119332 AuxR 171594
AtvV_Ap 73 Sb_Ap 146866
AtvV_Co 705 AtvV 119332
AtvV_Pa 90 Atr_Ap 117568
Atv_Ap 254 Pnom_Co 111903
Atv_Co 5077 Obj_Ap 94488
Atv_Pa 265 ExD_Ap 87377
AuxC 2522491 Pred_Pa 80484
AuxC_Ap 2 Coord_Ap 55677
AuxC_Co 60 Coord_Pa 41505
AuxC_Pa 46 Adv_Ap 31288
AuxG 3402843 Apos_Co 31269
AuxG_Ap 14 Pred_Ap 20806
AuxG_Co 330 Atr_Pa 19682
AuxG_Pa 489 Adv_Pa 18158
AuxK 7837441 AuxO 12422
AuxK_Pa 67 AuxY_Pa 5539
AuxO 12422 Atv_Co 5077
AuxP 10794852 Pnom_Ap 2902
AuxP_Pa 59 Apos_Ap 2440
AuxR 171594 AuxZ_Co 790
AuxT 2497283 AtrAdv_Co 740
AuxT_Pa 12 AtvV_Co 705
AuxV 1668548 AuxG_Pa 489
AuxV_Co 67 Obj_Pa 379
AuxX 7007444 AuxG_Co 330
AuxY 905768 AdvAtr_Co 309
AuxY_Co 7 AtrAdv 307
AuxY_Pa 5539 ObjAtr_Co 271
AuxZ 1852858 Atv_Pa 265
AuxZ_Co 790 AtrAtr_Co 263
AuxZ_Pa 251 Apos_Pa 262
Coord 4992966 Atv_Ap 254
Coord_Ap 55677 AuxZ_Pa 251
Coord_Co 364706 AtrObj_Co 229
Coord_Pa 41505 Sb_Pa 180
ExD 1747132 AtrAdv_Pa 93
ExD_Ap 87377 AtvV_Pa 90
ExD_Co 911226 AdvAtr 74
ExD_Pa 229260 AtvV_Ap 73
Obj 10461705 AtrAdv_Ap 72
ObjAtr 29 AuxK_Pa 67
ObjAtr_Co 271 AuxV_Co 67
Obj_Ap 94488 AuxC_Co 60
Obj_Co 1192756 AuxP_Pa 59
Obj_Pa 379 AtrObj 57
Pnom 1687985 AuxC_Pa 46
Pnom_Ap 2902 Pnom_Pa 41
Pnom_Co 111903 Adv_C 39
Pnom_Pa 41 AtrAtr 34
Pred 4912302 ObjAtr 29
Pred_Ap 20806 AdvAtr_Ap 14
Pred_Co 4860424 AuxG_Ap 14
Pred_Pa 80484 AuxT_Pa 12
Sb 6981795 AtrAtr_Pa 11
Sb_Ap 146866 AtrAtr_Ap 8
Sb_Co 956857 AuxY_Co 7
Sb_Pa 180 AuxC_Ap 2

Tomáš Jelínek