Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
seznamy:afun [2015/12/16 12:28] – tomasjelinek | seznamy:afun [2022/12/16 16:18] (aktuální) – jankrivan |
---|
====== Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun ====== | ====== Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun ====== |
| |
Syntaktické funkce použité v korpusu SYN2015 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. | Atributy **afun**, **p_afun**, **ep_afun** vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči ([[seznamy:parent|]]) či efektivnímu rodiči ([[seznamy:eparent|eparent]]). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce. |
| |
| Syntaktické funkce použité v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2015|SYN2020]] vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT). |
| |
Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. | Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. |
Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci Obj, ne Pred. | Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci //Obj//, ne //Pred//. |
| |
V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Anotační manuál PDT]]. | V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Anotační manuál PDT]]. |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pred]] | Predikát (přísudek) | pouze v hlavní větě | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pred]] | Predikát (přísudek) | pouze v hlavní větě | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s02.html|Sb]] | Subjekt (podmět) | | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s02.html|Sb]] | Subjekt (podmět) | | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s04.html|Obj]] | Objekt (předmět) | včetně určení činitele děje u opisného pasiva | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s04.html|Obj]] | Objekt (předmět) | včetně určení činitele děje u opisného pasiva; vč. infinitivu u modálních a fázových sloves aj. | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s05.html|Adv]] | Adverbiale (příslovečné určení) | bez dalšího rozlišení, vč. předložkových pádů u slovesa //být//, některých volných dativů aj. | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s05.html|Adv]] | Adverbiale (příslovečné určení) | bez dalšího rozlišení, vč. předložkových pádů u slovesa //být//, některých volných dativů aj. | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|Atv]] | Doplněk | jen tzv. určující; technicky zavěšen na neslovesném členu | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|Atv]] | Doplněk | jen tzv. určující; technicky zavěšen na neslovesném členu | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|AtvV]] | Doplněk | jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen) | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|AtvV]] | Doplněk | jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen) | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s03.html|Atr]] | Atribut (přívlastek) | včetně spojení typu //*Jan* Novák//, genitivu po číslovkách aj. | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s03.html|Atr]] | Atribut (přívlastek) | včetně spojení typu //**Jan** Novák//, genitivu po číslovkách aj. | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pnom]] | Jmenná část verbonom. přísudku se sponou //být, bývat// | mimo předložkové pády | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pnom]] | Jmenná část verbonom. přísudku | se sponou //být, bývat//; mimo předložkové pády | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|AuxV]] | Pomocné sloveso //být// (Auxiliary Verb) | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|AuxV]] | Pomocné sloveso //být// | (Auxiliary Verb) | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05.html#X_4_4_1_koordinace_vetna_i_vetneclenska_coord_afun_Co_|Coord]] | Koordinační uzel (souřadné spojení) | souřadicí spojka nebo interpunkce | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05.html#X_4_4_1_koordinace_vetna_i_vetneclenska_coord_afun_Co_|Coord]] | Koordinační uzel | uzel, který reprezentuje souřadicí spojení: souřadicí spojka nebo interpunkce | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05s02.html|Apos]] | Aposice (hlavní uzel) | spojovací slovo nebo interpunkční znaménko | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05s02.html|Apos]] | Aposice (hlavní uzel) | spojovací slovo nebo interpunkční znaménko | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s05.html|AuxT]] | Zvratné se u refl. tantum | neoddělitelné se – reflexivní tantum | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s05.html|AuxT]] | Zvratné se u refl. tantum | neoddělitelné se – reflexivní tantum | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s02.html|AuxP]] | Předložka | popř. všechny části složené předložky | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s02.html|AuxP]] | Předložka | popř. všechny části složené předložky | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07.html|AuxC]] | Spojka podřadicí | | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07.html|AuxC]] | Spojka podřadicí | | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s04.html|AuxO]] | Nadbytečný (odkazovací, emotivní) element | např. etické //ti// | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s04.html|AuxO]] | Nadbytečný element | odkazovací, emotivní element ap., např. etické //ti// | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s03.html|AuxZ]] | Zdůrazňovací slovo | | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s03.html|AuxZ]] | Zdůrazňovací slovo | | |
| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s08s03.html|AuxX]] | Čárka | ne však nositel koordinace nebo koncový symbol | | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s08s03.html|AuxX]] | Čárka | ne však nositel koordinace nebo koncový symbol | |
| |
Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. | Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. |
| V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu. |
| |
| |
| ===== Frekvence syntaktických funkcí ===== |
| |
| |
| Seznam značek a jejich frekvence v korpusu [[cnk:syn2020|SYN2020]]. |
| |
Seznam značek a jejich frekvence v korpusu SYN2015. | ^ Podle abecedy ^^ Podle frekvence ^^ |
| ^ Hodnota afun ^ Frekvence v korpusu SYN2020 ^ Hodnota afun ^ Frekvence v korpusu SYN2020 ^ |
| | Adv | 13606122 | Atr | 24027588 | |
| | Adv_Ap | 118237 | Adv | 13606122 | |
| | Adv_Co | 972500 | AuxP | 10895181 | |
| | Adv_Pa | 34429 | Obj | 9850532 | |
| | AdvAtr | 150 | AuxK | 7394997 | |
| | Apos | 423898 | Sb | 7296792 | |
| | Apos_Ap | 5506 | AuxX | 6723864 | |
| | Apos_Co | 29803 | Coord | 5157496 | |
| | Apos_Pa | 132 | Pred | 4593183 | |
| | Atr | 24027588 | Pred_Co | 4567266 | |
| | Atr_Ap | 152154 | AuxG | 3562591 | |
| | Atr_Co | 2385027 | AuxC | 2588938 | |
| | Atr_Pa | 34650 | Atr_Co | 2385027 | |
| | AtrAdv | 3144 | AuxT | 2355457 | |
| | AtrAdv_Ap | 7 | ExD | 2306191 | |
| | AtrAdv_Co | 2808 | AuxV | 1971742 | |
| | AtrAtr | 309 | AuxZ | 1869287 | |
| | AtrObj | 30 | Pnom | 1699987 | |
| | Atv | 175450 | Obj_Co | 1548946 | |
| | Atv_Ap | 607 | ExD_Co | 1537005 | |
| | Atv_Co | 15834 | Adv_Co | 972500 | |
| | Atv_Pa | 326 | AuxY | 938455 | |
| | AtvV | 155644 | Sb_Co | 846484 | |
| | AtvV_Ap | 453 | Coord_Co | 543552 | |
| | AtvV_Co | 12147 | Apos | 423898 | |
| | AtvV_Pa | 44 | ExD_Pa | 299692 | |
| | AuxC | 2588938 | AuxR | 275486 | |
| | AuxC_Co | 43 | Sb_Ap | 232850 | |
| | AuxG | 3562591 | Pnom_Co | 202656 | |
| | AuxG_Co | 26 | Atv | 175450 | |
| | AuxG_Pa | 267 | AtvV | 155644 | |
| | AuxK | 7394997 | Atr_Ap | 152154 | |
| | AuxK_Pa | 61 | Obj_Ap | 144558 | |
| | AuxO | 56266 | ExD_Ap | 121129 | |
| | AuxP | 10895181 | Adv_Ap | 118237 | |
| | AuxR | 275486 | Coord_Ap | 95230 | |
| | AuxT | 2355457 | Pred_Pa | 94500 | |
| | AuxV | 1971742 | Coord_Pa | 74753 | |
| | AuxV_Co | 131 | AuxO | 56266 | |
| | AuxX | 6723864 | Atr_Pa | 34650 | |
| | AuxY | 938455 | Adv_Pa | 34429 | |
| | AuxY_Pa | 5898 | Apos_Co | 29803 | |
| | AuxZ | 1869287 | Pnom_Ap | 20430 | |
| | AuxZ_Co | 2075 | Pred_Ap | 20085 | |
| | AuxZ_Pa | 306 | Atv_Co | 15834 | |
| | Coord | 5157496 | AtvV_Co | 12147 | |
| | Coord_Ap | 95230 | AuxY_Pa | 5898 | |
| | Coord_Co | 543552 | Apos_Ap | 5506 | |
| | Coord_Pa | 74753 | AtrAdv | 3144 | |
| | ExD | 2306191 | AtrAdv_Co | 2808 | |
| | ExD_Ap | 121129 | AuxZ_Co | 2075 | |
| | ExD_Co | 1537005 | Atv_Ap | 607 | |
| | ExD_Pa | 299692 | AtvV_Ap | 453 | |
| | Obj | 9850532 | Atv_Pa | 326 | |
| | Obj_Ap | 144558 | AtrAtr | 309 | |
| | Obj_Co | 1548946 | AuxZ_Pa | 306 | |
| | Obj_Pa | 151 | AuxG_Pa | 267 | |
| | ObjAtr | 1 | Obj_Pa | 151 | |
| | Pnom | 1699987 | AdvAtr | 150 | |
| | Pnom_Ap | 20430 | Apos_Pa | 132 | |
| | Pnom_Co | 202656 | AuxV_Co | 131 | |
| | Pred | 4593183 | AuxK_Pa | 61 | |
| | Pred_Ap | 20085 | AtvV_Pa | 44 | |
| | Pred_Co | 4567266 | AuxC_Co | 43 | |
| | Pred_Pa | 94500 | AtrObj | 30 | |
| | Sb | 7296792 | AuxG_Co | 26 | |
| | Sb_Ap | 232850 | AtrAdv_Ap | 7 | |
| | Sb_Co | 846484 | ObjAtr | 1 | |
| |
^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ | --- //Tomáš Jelínek// |
| Adv | 13710363 | | |
| AdvAtr | 74 | | |
| AdvAtr_Ap | 14 | | |
| AdvAtr_Co | 309 | | |
| Adv_Ap | 31288 | | |
| Adv_C | 39 | | |
| Adv_Co | 596299 | | |
| Adv_Pa | 18158 | | |
| Apos | 334041 | | |
| Apos_Ap | 2440 | | |
| Apos_Co | 31269 | | |
| Apos_Pa | 262 | | |
| Atr | 24859249 | | |
| AtrAdv | 307 | | |
| AtrAdv_Ap | 72 | | |
| AtrAdv_Co | 740 | | |
| AtrAdv_Pa | 93 | | |
| AtrAtr | 34 | | |
| AtrAtr_Ap | 8 | | |
| AtrAtr_Co | 263 | | |
| AtrAtr_Pa | 11 | | |
| AtrObj | 57 | | |
| AtrObj_Co | 229 | | |
| Atr_Ap | 117568 | | |
| Atr_Co | 2101018 | | |
| Atr_Pa | 19682 | | |
| Atv | 177471 | | |
| AtvV | 119332 | | |
| AtvV_Ap | 73 | | |
| AtvV_Co | 705 | | |
| AtvV_Pa | 90 | | |
| Atv_Ap | 254 | | |
| Atv_Co | 5077 | | |
| Atv_Pa | 265 | | |
| AuxC | 2522491 | | |
| AuxC_Ap | 2 | | |
| AuxC_Co | 60 | | |
| AuxC_Pa | 46 | | |
| AuxG | 3402843 | | |
| AuxG_Ap | 14 | | |
| AuxG_Co | 330 | | |
| AuxG_Pa | 489 | | |
| AuxK | 7837441 | | |
| AuxK_Pa | 67 | | |
| AuxO | 12422 | | |
| AuxP | 10794852 | | |
| AuxP_Pa | 59 | | |
| AuxR | 171594 | | |
| AuxT | 2497283 | | |
| AuxT_Pa | 12 | | |
| AuxV | 1668548 | | |
| AuxV_Co | 67 | | |
| AuxX | 7007444 | | |
| AuxY | 905768 | | |
| AuxY_Co | 7 | | |
| AuxY_Pa | 5539 | | |
| AuxZ | 1852858 | | |
| AuxZ_Co | 790 | | |
| AuxZ_Pa | 251 | | |
| Coord | 4992966 | | |
| Coord_Ap | 55677 | | |
| Coord_Co | 364706 | | |
| Coord_Pa | 41505 | | |
| ExD | 1747132 | | |
| ExD_Ap | 87377 | | |
| ExD_Co | 911226 | | |
| ExD_Pa | 229260 | | |
| Obj | 10461705 | | |
| ObjAtr | 29 | | |
| ObjAtr_Co | 271 | | |
| Obj_Ap | 94488 | | |
| Obj_Co | 1192756 | | |
| Obj_Pa | 379 | | |
| Pnom | 1687985 | | |
| Pnom_Ap | 2902 | | |
| Pnom_Co | 111903 | | |
| Pnom_Pa | 41 | | |
| Pred | 4912302 | | |
| Pred_Ap | 20806 | | |
| Pred_Co | 4860424 | | |
| Pred_Pa | 80484 | | |
| Sb | 6981795 | | |
| Sb_Ap | 146866 | | |
| Sb_Co | 956857 | | |
| Sb_Pa | 180 | | |