AplikaceAplikace
Nastavení

Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun

Atributy afun, p_afun, ep_afun vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči (parent) či efektivnímu rodiči (eparent). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce.

Syntaktické funkce použité v korpusech SYN2015 a SYN2020 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu (PDT). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT).

Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci Obj, ne Pred.

V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na Anotační manuál PDT.

Afun Definice Poznámka
Pred Predikát (přísudek) pouze v hlavní větě
Sb Subjekt (podmět)
Obj Objekt (předmět) včetně určení činitele děje u opisného pasiva; vč. infinitivu u modálních a fázových sloves aj.
Adv Adverbiale (příslovečné určení) bez dalšího rozlišení, vč. předložkových pádů u slovesa být, některých volných dativů aj.
Atv Doplněk jen tzv. určující; technicky zavěšen na neslovesném členu
AtvV Doplněk jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen)
Atr Atribut (přívlastek) včetně spojení typu Jan Novák, genitivu po číslovkách aj.
Pnom Jmenná část verbonom. přísudku se sponou být, bývat; mimo předložkové pády
AuxV Pomocné sloveso být (Auxiliary Verb)
Coord Koordinační uzel uzel, který reprezentuje souřadicí spojení: souřadicí spojka nebo interpunkce
Apos Aposice (hlavní uzel) spojovací slovo nebo interpunkční znaménko
AuxT Zvratné se u refl. tantum neoddělitelné se – reflexivní tantum
AuxR Zvratné se u pasiva zvratné se, které není Obj ani AuxT (tvoří pasivum reflexivní)
AuxP Předložka popř. všechny části složené předložky
AuxC Spojka podřadicí
AuxO Nadbytečný element odkazovací, emotivní element ap., např. etické ti
AuxZ Zdůrazňovací slovo
AuxX Čárka ne však nositel koordinace nebo koncový symbol
AuxG Jiné grafické symboly, které neukončují větu
AuxY Příslovce a částice, které nelze zařadit jinam
AuxK Koncová interpunkce věty
ExD Součást aktuální elipsy náhradní funkce pro technické hrany vedoucí místo od elidovaného členu k „pseudořídícímu“ slovu nebo pro hlavní člen věty bez predikátu (Ex-Dependent); také ve srovnávacích spojeních typu zdravý jako ryba

Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu.

Frekvence syntaktických funkcí

Seznam značek a jejich frekvence v korpusu SYN2020.

Podle abecedy Podle frekvence
Hodnota afun Frekvence v korpusu SYN2020 Hodnota afun Frekvence v korpusu SYN2020
Adv 13606122 Atr 24027588
Adv_Ap 118237 Adv 13606122
Adv_Co 972500 AuxP 10895181
Adv_Pa 34429 Obj 9850532
AdvAtr 150 AuxK 7394997
Apos 423898 Sb 7296792
Apos_Ap 5506 AuxX 6723864
Apos_Co 29803 Coord 5157496
Apos_Pa 132 Pred 4593183
Atr 24027588 Pred_Co 4567266
Atr_Ap 152154 AuxG 3562591
Atr_Co 2385027 AuxC 2588938
Atr_Pa 34650 Atr_Co 2385027
AtrAdv 3144 AuxT 2355457
AtrAdv_Ap 7 ExD 2306191
AtrAdv_Co 2808 AuxV 1971742
AtrAtr 309 AuxZ 1869287
AtrObj 30 Pnom 1699987
Atv 175450 Obj_Co 1548946
Atv_Ap 607 ExD_Co 1537005
Atv_Co 15834 Adv_Co 972500
Atv_Pa 326 AuxY 938455
AtvV 155644 Sb_Co 846484
AtvV_Ap 453 Coord_Co 543552
AtvV_Co 12147 Apos 423898
AtvV_Pa 44 ExD_Pa 299692
AuxC 2588938 AuxR 275486
AuxC_Co 43 Sb_Ap 232850
AuxG 3562591 Pnom_Co 202656
AuxG_Co 26 Atv 175450
AuxG_Pa 267 AtvV 155644
AuxK 7394997 Atr_Ap 152154
AuxK_Pa 61 Obj_Ap 144558
AuxO 56266 ExD_Ap 121129
AuxP 10895181 Adv_Ap 118237
AuxR 275486 Coord_Ap 95230
AuxT 2355457 Pred_Pa 94500
AuxV 1971742 Coord_Pa 74753
AuxV_Co 131 AuxO 56266
AuxX 6723864 Atr_Pa 34650
AuxY 938455 Adv_Pa 34429
AuxY_Pa 5898 Apos_Co 29803
AuxZ 1869287 Pnom_Ap 20430
AuxZ_Co 2075 Pred_Ap 20085
AuxZ_Pa 306 Atv_Co 15834
Coord 5157496 AtvV_Co 12147
Coord_Ap 95230 AuxY_Pa 5898
Coord_Co 543552 Apos_Ap 5506
Coord_Pa 74753 AtrAdv 3144
ExD 2306191 AtrAdv_Co 2808
ExD_Ap 121129 AuxZ_Co 2075
ExD_Co 1537005 Atv_Ap 607
ExD_Pa 299692 AtvV_Ap 453
Obj 9850532 Atv_Pa 326
Obj_Ap 144558 AtrAtr 309
Obj_Co 1548946 AuxZ_Pa 306
Obj_Pa 151 AuxG_Pa 267
ObjAtr 1 Obj_Pa 151
Pnom 1699987 AdvAtr 150
Pnom_Ap 20430 Apos_Pa 132
Pnom_Co 202656 AuxV_Co 131
Pred 4593183 AuxK_Pa 61
Pred_Ap 20085 AtvV_Pa 44
Pred_Co 4567266 AuxC_Co 43
Pred_Pa 94500 AtrObj 30
Sb 7296792 AuxG_Co 26
Sb_Ap 232850 AtrAdv_Ap 7
Sb_Co 846484 ObjAtr 1

Tomáš Jelínek