AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:afun [2015/12/16 14:09] Tomáš Jelínekseznamy:afun [2022/12/16 16:18] (aktuální) Jan Křivan
Řádek 1: Řádek 1:
 ====== Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun ====== ====== Syntaktické funkce, hodnoty atributů: afun, p_afun a ep_afun ======
  
-Syntaktické funkce použité v korpusu SYN2015 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. +Atributy **afun**, **p_afun**, **ep_afun** vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči ([[seznamy:parent|]]) či efektivnímu rodiči ([[seznamy:eparent|eparent]]). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce. 
 + 
 +Syntaktické funkce použité v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2015|SYN2020]] vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT).
  
 Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap.  Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. 
-Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci Obj, ne Pred.+Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci //Obj//, ne //Pred//.
  
 V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Anotační manuál PDT]]. V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Anotační manuál PDT]].
Řádek 33: Řádek 35:
  
 Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap.
 +V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu.
 +
 +
 +===== Frekvence syntaktických funkcí =====
 +
  
 +Seznam značek a jejich frekvence v korpusu [[cnk:syn2020|SYN2020]].
  
-Seznam značek a jejich frekvence v korpusu SYN2015.+^  Podle abecedy  ^^  Podle frekvence  ^^ 
 +^ Hodnota afun ^ Frekvence v korpusu SYN2020 ^ Hodnota afun ^ Frekvence v korpusu SYN2020 ^ 
 +| Adv | 13606122 | Atr | 24027588 | 
 +| Adv_Ap | 118237 | Adv | 13606122 | 
 +| Adv_Co | 972500 | AuxP | 10895181 | 
 +| Adv_Pa | 34429 | Obj | 9850532 | 
 +| AdvAtr | 150 | AuxK | 7394997 | 
 +| Apos | 423898 | Sb | 7296792 | 
 +| Apos_Ap | 5506 | AuxX | 6723864 | 
 +| Apos_Co | 29803 | Coord | 5157496 | 
 +| Apos_Pa | 132 | Pred | 4593183 | 
 +| Atr | 24027588 | Pred_Co | 4567266 | 
 +| Atr_Ap | 152154 | AuxG | 3562591 | 
 +| Atr_Co | 2385027 | AuxC | 2588938 | 
 +| Atr_Pa | 34650 | Atr_Co | 2385027 | 
 +| AtrAdv | 3144 | AuxT | 2355457 | 
 +| AtrAdv_Ap | 7 | ExD | 2306191 | 
 +| AtrAdv_Co | 2808 | AuxV | 1971742 | 
 +| AtrAtr | 309 | AuxZ | 1869287 | 
 +| AtrObj | 30 | Pnom | 1699987 | 
 +| Atv | 175450 | Obj_Co | 1548946 | 
 +| Atv_Ap | 607 | ExD_Co | 1537005 | 
 +| Atv_Co | 15834 | Adv_Co | 972500 | 
 +| Atv_Pa | 326 | AuxY | 938455 | 
 +| AtvV | 155644 | Sb_Co | 846484 | 
 +| AtvV_Ap | 453 | Coord_Co | 543552 | 
 +| AtvV_Co | 12147 | Apos | 423898 | 
 +| AtvV_Pa | 44 | ExD_Pa | 299692 | 
 +| AuxC | 2588938 | AuxR | 275486 | 
 +| AuxC_Co | 43 | Sb_Ap | 232850 | 
 +| AuxG | 3562591 | Pnom_Co | 202656 | 
 +| AuxG_Co | 26 | Atv | 175450 | 
 +| AuxG_Pa | 267 | AtvV | 155644 | 
 +| AuxK | 7394997 | Atr_Ap | 152154 | 
 +| AuxK_Pa | 61 | Obj_Ap | 144558 | 
 +| AuxO | 56266 | ExD_Ap | 121129 | 
 +| AuxP | 10895181 | Adv_Ap | 118237 | 
 +| AuxR | 275486 | Coord_Ap | 95230 | 
 +| AuxT | 2355457 | Pred_Pa | 94500 | 
 +| AuxV | 1971742 | Coord_Pa | 74753 | 
 +| AuxV_Co | 131 | AuxO | 56266 | 
 +| AuxX | 6723864 | Atr_Pa | 34650 | 
 +| AuxY | 938455 | Adv_Pa | 34429 | 
 +| AuxY_Pa | 5898 | Apos_Co | 29803 | 
 +| AuxZ | 1869287 | Pnom_Ap | 20430 | 
 +| AuxZ_Co | 2075 | Pred_Ap | 20085 | 
 +| AuxZ_Pa | 306 | Atv_Co | 15834 | 
 +| Coord | 5157496 | AtvV_Co | 12147 | 
 +| Coord_Ap | 95230 | AuxY_Pa | 5898 | 
 +| Coord_Co | 543552 | Apos_Ap | 5506 | 
 +| Coord_Pa | 74753 | AtrAdv | 3144 | 
 +| ExD | 2306191 | AtrAdv_Co | 2808 | 
 +| ExD_Ap | 121129 | AuxZ_Co | 2075 | 
 +| ExD_Co | 1537005 | Atv_Ap | 607 | 
 +| ExD_Pa | 299692 | AtvV_Ap | 453 | 
 +| Obj | 9850532 | Atv_Pa | 326 | 
 +| Obj_Ap | 144558 | AtrAtr | 309 | 
 +| Obj_Co | 1548946 | AuxZ_Pa | 306 | 
 +| Obj_Pa | 151 | AuxG_Pa | 267 | 
 +| ObjAtr | 1 | Obj_Pa | 151 | 
 +| Pnom | 1699987 | AdvAtr | 150 | 
 +| Pnom_Ap | 20430 | Apos_Pa | 132 | 
 +| Pnom_Co | 202656 | AuxV_Co | 131 | 
 +| Pred | 4593183 | AuxK_Pa | 61 | 
 +| Pred_Ap | 20085 | AtvV_Pa | 44 | 
 +| Pred_Co | 4567266 | AuxC_Co | 43 | 
 +| Pred_Pa | 94500 | AtrObj | 30 | 
 +| Sb | 7296792 | AuxG_Co | 26 | 
 +| Sb_Ap | 232850 | AtrAdv_Ap | 7 | 
 +| Sb_Co | 846484 | ObjAtr | 1 |
  
-^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ + --- //Tomáš Jelínek//
-| Adv |  13710363 | +
-| AdvAtr |  74 | +
-| AdvAtr_Ap |  14 | +
-| AdvAtr_Co |  309 | +
-| Adv_Ap |  31288 | +
-| Adv_C |  39 | +
-| Adv_Co |  596299 | +
-| Adv_Pa |  18158 | +
-| Apos |  334041 | +
-| Apos_Ap |  2440 | +
-| Apos_Co |  31269 | +
-| Apos_Pa |  262 | +
-| Atr |  24859249 | +
-| AtrAdv |  307 | +
-| AtrAdv_Ap |  72 | +
-| AtrAdv_Co |  740 | +
-| AtrAdv_Pa |  93 | +
-| AtrAtr |  34 | +
-| AtrAtr_Ap |  8 | +
-| AtrAtr_Co |  263 | +
-| AtrAtr_Pa |  11 | +
-| AtrObj |  57 | +
-| AtrObj_Co |  229 | +
-| Atr_Ap |  117568 | +
-| Atr_Co |  2101018 | +
-| Atr_Pa |  19682 | +
-| Atv |  177471 | +
-| AtvV |  119332 | +
-| AtvV_Ap |  73 | +
-| AtvV_Co |  705 | +
-| AtvV_Pa |  90 | +
-| Atv_Ap |  254 | +
-| Atv_Co |  5077 | +
-| Atv_Pa |  265 | +
-| AuxC |  2522491 | +
-| AuxC_Ap |  2 | +
-| AuxC_Co |  60 | +
-| AuxC_Pa |  46 | +
-| AuxG |  3402843 | +
-| AuxG_Ap |  14 | +
-| AuxG_Co |  330 | +
-| AuxG_Pa |  489 | +
-| AuxK |  7837441 | +
-| AuxK_Pa |  67 | +
-| AuxO |  12422 | +
-| AuxP |  10794852 | +
-| AuxP_Pa |  59 | +
-| AuxR |  171594 | +
-| AuxT |  2497283 | +
-| AuxT_Pa |  12 | +
-| AuxV |  1668548 | +
-| AuxV_Co |  67 | +
-| AuxX |  7007444 | +
-| AuxY |  905768 | +
-| AuxY_Co |  7 | +
-| AuxY_Pa |  5539 | +
-| AuxZ |  1852858 | +
-| AuxZ_Co |  790 | +
-| AuxZ_Pa |  251 | +
-| Coord |  4992966 | +
-| Coord_Ap |  55677 | +
-| Coord_Co |  364706 | +
-| Coord_Pa |  41505 | +
-| ExD |  1747132 | +
-| ExD_Ap |  87377 | +
-| ExD_Co |  911226 | +
-| ExD_Pa |  229260 | +
-| Obj |  10461705 | +
-| ObjAtr |  29 | +
-| ObjAtr_Co |  271 | +
-| Obj_Ap |  94488 | +
-| Obj_Co |  1192756 | +
-| Obj_Pa |  379 | +
-| Pnom |  1687985 | +
-| Pnom_Ap |  2902 | +
-| Pnom_Co |  111903 | +
-| Pnom_Pa |  41 | +
-| Pred |  4912302 | +
-| Pred_Ap |  20806 | +
-| Pred_Co |  4860424 | +
-| Pred_Pa |  80484 | +
-| Sb |  6981795 | +
-| Sb_Ap |  146866 | +
-| Sb_Co |  956857 | +
-| Sb_Pa |  180 |+