AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
seznamy:afun [2015/12/16 14:07] tomasjelinekseznamy:afun [2022/12/15 17:05] tomasjelinek
Řádek 1: Řádek 1:
 ====== Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun ====== ====== Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun ======
  
-Syntaktické funkce použité v korpusu SYN2015 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. +Atributy **afun**, **p_afun**, **ep_afun** vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči ([[seznamy:parent|]]) či efektivnímu rodiči ([[seznamy:eparent|eparent]]). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce. 
 + 
 +Syntaktické funkce použité v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2015|SYN2020]] vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT).
  
 Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap.  Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. 
-Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci Obj, ne Pred.+Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci //Obj//, ne //Pred//.
  
 V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Anotační manuál PDT]]. V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Anotační manuál PDT]].
Řádek 16: Řádek 18:
 | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|AtvV]] | Doplněk | jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen) | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|AtvV]] | Doplněk | jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen) |
 | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s03.html|Atr]] | Atribut (přívlastek) | včetně spojení typu //**Jan** Novák//, genitivu po číslovkách aj. | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s03.html|Atr]] | Atribut (přívlastek) | včetně spojení typu //**Jan** Novák//, genitivu po číslovkách aj. |
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pnom]] | Jmenná část verbonom. přísudku |  se sponou //být, bývat//; mimo předložkové pády | +| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pnom]] | Jmenná část verbonom. přísudku | se sponou //být, bývat//; mimo předložkové pády | 
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|AuxV]] | Pomocné sloveso //být// (Auxiliary Verb) |+| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|AuxV]] | Pomocné sloveso //být// (Auxiliary Verb) |
 | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05.html#X_4_4_1_koordinace_vetna_i_vetneclenska_coord_afun_Co_|Coord]] | Koordinační uzel | uzel, který reprezentuje souřadicí spojení: souřadicí spojka nebo interpunkce | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05.html#X_4_4_1_koordinace_vetna_i_vetneclenska_coord_afun_Co_|Coord]] | Koordinační uzel | uzel, který reprezentuje souřadicí spojení: souřadicí spojka nebo interpunkce |
 | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05s02.html|Apos]] | Aposice (hlavní uzel) | spojovací slovo nebo interpunkční znaménko | | [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05s02.html|Apos]] | Aposice (hlavní uzel) | spojovací slovo nebo interpunkční znaménko |
Řádek 33: Řádek 35:
  
 Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap.
 +V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu.
 +
 +
 +===== Frekvence syntaktických funkcí =====
 +
  
 +Seznam značek a jejich frekvence v korpusu [[cnk:syn2015|SYN2015]].
  
-Seznam značek a jejich frekvence v korpusu SYN2015.+^  Podle abecedy  ^^  Podle frekvence  ^^ 
 +^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ 
 +| Adv | 13710363 | Atr | 24859249 | 
 +| AdvAtr | 74 | Adv | 13710363 | 
 +| AdvAtr_Ap | 14 | AuxP | 10794852 | 
 +| AdvAtr_Co | 309 | Obj | 10461705 | 
 +| Adv_Ap | 31288 | AuxK | 7837441 | 
 +| Adv_C | 39 | AuxX | 7007444 | 
 +| Adv_Co | 596299 | Sb | 6981795 | 
 +| Adv_Pa | 18158 | Coord | 4992966 | 
 +| Apos | 334041 | Pred | 4912302 | 
 +| Apos_Ap | 2440 | Pred_Co | 4860424 | 
 +| Apos_Co | 31269 | AuxG | 3402843 | 
 +| Apos_Pa | 262 | AuxC | 2522491 | 
 +| Atr | 24859249 | AuxT | 2497283 | 
 +| AtrAdv | 307 | Atr_Co | 2101018 | 
 +| AtrAdv_Ap | 72 | AuxZ | 1852858 | 
 +| AtrAdv_Co | 740 | ExD | 1747132 | 
 +| AtrAdv_Pa | 93 | Pnom | 1687985 | 
 +| AtrAtr | 34 | AuxV | 1668548 | 
 +| AtrAtr_Ap | 8 | Obj_Co | 1192756 | 
 +| AtrAtr_Co | 263 | Sb_Co | 956857 | 
 +| AtrAtr_Pa | 11 | ExD_Co | 911226 | 
 +| AtrObj | 57 | AuxY | 905768 | 
 +| AtrObj_Co | 229 | Adv_Co | 596299 | 
 +| Atr_Ap | 117568 | Coord_Co | 364706 | 
 +| Atr_Co | 2101018 | Apos | 334041 | 
 +| Atr_Pa | 19682 | ExD_Pa | 229260 | 
 +| Atv | 177471 | Atv | 177471 | 
 +| AtvV | 119332 | AuxR | 171594 | 
 +| AtvV_Ap | 73 | Sb_Ap | 146866 | 
 +| AtvV_Co | 705 | AtvV | 119332 | 
 +| AtvV_Pa | 90 | Atr_Ap | 117568 | 
 +| Atv_Ap | 254 | Pnom_Co | 111903 | 
 +| Atv_Co | 5077 | Obj_Ap | 94488 | 
 +| Atv_Pa | 265 | ExD_Ap | 87377 | 
 +| AuxC | 2522491 | Pred_Pa | 80484 | 
 +| AuxC_Ap | 2 | Coord_Ap | 55677 | 
 +| AuxC_Co | 60 | Coord_Pa | 41505 | 
 +| AuxC_Pa | 46 | Adv_Ap | 31288 | 
 +| AuxG | 3402843 | Apos_Co | 31269 | 
 +| AuxG_Ap | 14 | Pred_Ap | 20806 | 
 +| AuxG_Co | 330 | Atr_Pa | 19682 | 
 +| AuxG_Pa | 489 | Adv_Pa | 18158 | 
 +| AuxK | 7837441 | AuxO | 12422 | 
 +| AuxK_Pa | 67 | AuxY_Pa | 5539 | 
 +| AuxO | 12422 | Atv_Co | 5077 | 
 +| AuxP | 10794852 | Pnom_Ap | 2902 | 
 +| AuxP_Pa | 59 | Apos_Ap | 2440 | 
 +| AuxR | 171594 | AuxZ_Co | 790 | 
 +| AuxT | 2497283 | AtrAdv_Co | 740 | 
 +| AuxT_Pa | 12 | AtvV_Co | 705 | 
 +| AuxV | 1668548 | AuxG_Pa | 489 | 
 +| AuxV_Co | 67 | Obj_Pa | 379 | 
 +| AuxX | 7007444 | AuxG_Co | 330 | 
 +| AuxY | 905768 | AdvAtr_Co | 309 | 
 +| AuxY_Co | 7 | AtrAdv | 307 | 
 +| AuxY_Pa | 5539 | ObjAtr_Co | 271 | 
 +| AuxZ | 1852858 | Atv_Pa | 265 | 
 +| AuxZ_Co | 790 | AtrAtr_Co | 263 | 
 +| AuxZ_Pa | 251 | Apos_Pa | 262 | 
 +| Coord | 4992966 | Atv_Ap | 254 | 
 +| Coord_Ap | 55677 | AuxZ_Pa | 251 | 
 +| Coord_Co | 364706 | AtrObj_Co | 229 | 
 +| Coord_Pa | 41505 | Sb_Pa | 180 | 
 +| ExD | 1747132 | AtrAdv_Pa | 93 | 
 +| ExD_Ap | 87377 | AtvV_Pa | 90 | 
 +| ExD_Co | 911226 | AdvAtr | 74 | 
 +| ExD_Pa | 229260 | AtvV_Ap | 73 | 
 +| Obj | 10461705 | AtrAdv_Ap | 72 | 
 +| ObjAtr | 29 | AuxK_Pa | 67 | 
 +| ObjAtr_Co | 271 | AuxV_Co | 67 | 
 +| Obj_Ap | 94488 | AuxC_Co | 60 | 
 +| Obj_Co | 1192756 | AuxP_Pa | 59 | 
 +| Obj_Pa | 379 | AtrObj | 57 | 
 +| Pnom | 1687985 | AuxC_Pa | 46 | 
 +| Pnom_Ap | 2902 | Pnom_Pa | 41 | 
 +| Pnom_Co | 111903 | Adv_C | 39 | 
 +| Pnom_Pa | 41 | AtrAtr | 34 | 
 +| Pred | 4912302 | ObjAtr | 29 | 
 +| Pred_Ap | 20806 | AdvAtr_Ap | 14 | 
 +| Pred_Co | 4860424 | AuxG_Ap | 14 | 
 +| Pred_Pa | 80484 | AuxT_Pa | 12 | 
 +| Sb | 6981795 | AtrAtr_Pa | 11 | 
 +| Sb_Ap | 146866 | AtrAtr_Ap | 8 | 
 +| Sb_Co | 956857 | AuxY_Co | 7 | 
 +| Sb_Pa | 180 | AuxC_Ap | 2 |
  
-^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ + --- //Tomáš Jelínek//
-| Adv |  13710363 | +
-| AdvAtr |  74 | +
-| AdvAtr_Ap |  14 | +
-| AdvAtr_Co |  309 | +
-| Adv_Ap |  31288 | +
-| Adv_C |  39 | +
-| Adv_Co |  596299 | +
-| Adv_Pa |  18158 | +
-| Apos |  334041 | +
-| Apos_Ap |  2440 | +
-| Apos_Co |  31269 | +
-| Apos_Pa |  262 | +
-| Atr |  24859249 | +
-| AtrAdv |  307 | +
-| AtrAdv_Ap |  72 | +
-| AtrAdv_Co |  740 | +
-| AtrAdv_Pa |  93 | +
-| AtrAtr |  34 | +
-| AtrAtr_Ap |  8 | +
-| AtrAtr_Co |  263 | +
-| AtrAtr_Pa |  11 | +
-| AtrObj |  57 | +
-| AtrObj_Co |  229 | +
-| Atr_Ap |  117568 | +
-| Atr_Co |  2101018 | +
-| Atr_Pa |  19682 | +
-| Atv |  177471 | +
-| AtvV |  119332 | +
-| AtvV_Ap |  73 | +
-| AtvV_Co |  705 | +
-| AtvV_Pa |  90 | +
-| Atv_Ap |  254 | +
-| Atv_Co |  5077 | +
-| Atv_Pa |  265 | +
-| AuxC |  2522491 | +
-| AuxC_Ap |  2 | +
-| AuxC_Co |  60 | +
-| AuxC_Pa |  46 | +
-| AuxG |  3402843 | +
-| AuxG_Ap |  14 | +
-| AuxG_Co |  330 | +
-| AuxG_Pa |  489 | +
-| AuxK |  7837441 | +
-| AuxK_Pa |  67 | +
-| AuxO |  12422 | +
-| AuxP |  10794852 | +
-| AuxP_Pa |  59 | +
-| AuxR |  171594 | +
-| AuxT |  2497283 | +
-| AuxT_Pa |  12 | +
-| AuxV |  1668548 | +
-| AuxV_Co |  67 | +
-| AuxX |  7007444 | +
-| AuxY |  905768 | +
-| AuxY_Co |  7 | +
-| AuxY_Pa |  5539 | +
-| AuxZ |  1852858 | +
-| AuxZ_Co |  790 | +
-| AuxZ_Pa |  251 | +
-| Coord |  4992966 | +
-| Coord_Ap |  55677 | +
-| Coord_Co |  364706 | +
-| Coord_Pa |  41505 | +
-| ExD |  1747132 | +
-| ExD_Ap |  87377 | +
-| ExD_Co |  911226 | +
-| ExD_Pa |  229260 | +
-| Obj |  10461705 | +
-| ObjAtr |  29 | +
-| ObjAtr_Co |  271 | +
-| Obj_Ap |  94488 | +
-| Obj_Co |  1192756 | +
-| Obj_Pa |  379 | +
-| Pnom |  1687985 | +
-| Pnom_Ap |  2902 | +
-| Pnom_Co |  111903 | +
-| Pnom_Pa |  41 | +
-| Pred |  4912302 | +
-| Pred_Ap |  20806 | +
-| Pred_Co |  4860424 | +
-| Pred_Pa |  80484 | +
-| Sb |  6981795 | +
-| Sb_Ap |  146866 | +
-| Sb_Co |  956857 | +
-| Sb_Pa |  180 |+