AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:afun [2015/12/16 16:22] Tomáš Jelínekseznamy:afun [2022/12/16 16:18] (aktuální) Jan Křivan
Řádek 3: Řádek 3:
 Atributy **afun**, **p_afun**, **ep_afun** vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči ([[seznamy:parent|]]) či efektivnímu rodiči ([[seznamy:eparent|eparent]]). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce. Atributy **afun**, **p_afun**, **ep_afun** vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči ([[seznamy:parent|]]) či efektivnímu rodiči ([[seznamy:eparent|eparent]]). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce.
  
-Syntaktické funkce použité v korpusu SYN2015 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauer, předmět v PDT).+Syntaktické funkce použité v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2015|SYN2020]] vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT).
  
 Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap.  Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. 
Řádek 35: Řádek 35:
  
 Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap.
 +V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu.
  
  
-Seznam značek a jejich frekvence v korpusu SYN2015.+===== Frekvence syntaktických funkcí =====
  
-^ Hodnota afun ^ Frekvence v korpusu SYN2015 + 
-| Adv |  13710363 | +Seznam značek a jejich frekvence v korpusu [[cnk:syn2020|SYN2020]]. 
-AdvAtr |  74 + 
-AdvAtr_Ap  14 | +^  Podle abecedy  ^^  Podle frekvence  ^^ 
-AdvAtr_Co |  309 +^ Hodnota afun ^ Frekvence v korpusu SYN2020 ^ Hodnota afun ^ Frekvence v korpusu SYN2020 
-Adv_Ap  31288 | +| Adv | 13606122 Atr 24027588 
-Adv_C |  39 +Adv_Ap 118237 Adv 13606122 
-Adv_Co  596299 +Adv_Co 972500 AuxP 10895181 
-Adv_Pa  18158 +Adv_Pa 34429 | Obj | 9850532 
-| Apos |  334041 +AdvAtr 150 | AuxK | 7394997 
-| Apos_Ap |  2440 +| Apos | 423898 | Sb | 7296792 
-| Apos_Co |  31269 +| Apos_Ap | 5506 | AuxX | 6723864 
-| Apos_Pa |  262 +| Apos_Co | 29803 | Coord | 5157496 
-| Atr |  24859249 | +| Apos_Pa | 132 | Pred | 4593183 
-AtrAdv |  307 +| Atr | 24027588 Pred_Co 4567266 
-AtrAdv_Ap  72 +Atr_Ap 152154 | AuxG | 3562591 
-AtrAdv_Co  740 +Atr_Co 2385027 | AuxC | 2588938 
-AtrAdv_Pa  93 +Atr_Pa 34650 | Atr_Co | 2385027 
-AtrAtr  34 +AtrAdv 3144 | AuxT | 2355457 
-AtrAtr_Ap  +AtrAdv_Ap 7 | ExD | 2306191 
-AtrAtr_Co  263 +AtrAdv_Co 2808 | AuxV | 1971742 
-AtrAtr_Pa  11 +AtrAtr 309 | AuxZ | 1869287 
-| AtrObj |  57 | +| AtrObj | 30 Pnom 1699987 
-AtrObj_Co |  229 +Atv 175450 | Obj_Co | 1548946 
-Atr_Ap  117568 +Atv_Ap 607 | ExD_Co | 1537005 
-Atr_Co  2101018 +Atv_Co 15834 | Adv_Co | 972500 
-Atr_Pa  19682 +Atv_Pa 326 | AuxY | 938455 
-Atv  177471 +| AtvV | 155644 | Sb_Co | 846484 
-| AtvV |  119332 +| AtvV_Ap | 453 Coord_Co 543552 
-| AtvV_Ap |  73 | +AtvV_Co 12147 Apos 423898 
-AtvV_Co |  705 +AtvV_Pa 44 ExD_Pa 299692 
-AtvV_Pa  90 | +| AuxC | 2588938 AuxR 275486 
-Atv_Ap |  254 +| AuxC_Co | 43 Sb_Ap 232850 
-Atv_Co  5077 | +| AuxG | 3562591 Pnom_Co 202656 
-Atv_Pa |  265 +| AuxG_Co | 26 | Atv | 175450 
-| AuxC |  2522491 | +| AuxG_Pa | 267 | AtvV | 155644 
-AuxC_Ap |  2 +| AuxK | 7394997 | Atr_Ap | 152154 
-| AuxC_Co |  60 | +| AuxK_Pa | 61 | Obj_Ap | 144558 
-AuxC_Pa |  46 +| AuxO | 56266 | ExD_Ap | 121129 
-| AuxG |  3402843 | +| AuxP | 10895181 Adv_Ap 118237 
-AuxG_Ap |  14 +| AuxR | 275486 | Coord_Ap | 95230 
-| AuxG_Co |  330 +| AuxT | 2355457 Pred_Pa 94500 
-| AuxG_Pa |  489 +| AuxV | 1971742 | Coord_Pa | 74753 
-| AuxK |  7837441 +| AuxV_Co | 131 | AuxO | 56266 
-| AuxK_Pa |  67 +| AuxX | 6723864 | Atr_Pa | 34650 
-| AuxO |  12422 +| AuxY | 938455 Adv_Pa 34429 
-| AuxP |  10794852 | +| AuxY_Pa | 5898 | Apos_Co | 29803 
-AuxP_Pa |  59 +| AuxZ | 1869287 | Pnom_Ap | 20430 
-| AuxR |  171594 +| AuxZ_Co | 2075 | Pred_Ap | 20085 
-| AuxT |  2497283 | +| AuxZ_Pa | 306 | Atv_Co | 15834 
-AuxT_Pa |  12 +| Coord | 5157496 | AtvV_Co | 12147 
-| AuxV |  1668548 +| Coord_Ap | 95230 | AuxY_Pa | 5898 
-| AuxV_Co |  67 +| Coord_Co | 543552 | Apos_Ap | 5506 
-| AuxX |  7007444 +| Coord_Pa | 74753 | AtrAdv | 3144 
-| AuxY |  905768 | +| ExD | 2306191 | AtrAdv_Co | 2808 
-AuxY_Co |  7 +| ExD_Ap | 121129 | AuxZ_Co | 2075 
-| AuxY_Pa |  5539 +| ExD_Co | 1537005 | Atv_Ap | 607 
-| AuxZ |  1852858 +| ExD_Pa | 299692 | AtvV_Ap | 453 
-| AuxZ_Co |  790 +| Obj | 9850532 Atv_Pa 326 
-| AuxZ_Pa |  251 +Obj_Ap 144558 | AtrAtr | 309 
-| Coord |  4992966 +Obj_Co 1548946 | AuxZ_Pa | 306 
-| Coord_Ap |  55677 +Obj_Pa 151 | AuxG_Pa | 267 
-| Coord_Co |  364706 +| ObjAtr | 1 | Obj_Pa | 151 
-| Coord_Pa |  41505 +| Pnom | 1699987 | AdvAtr | 150 
-| ExD |  1747132 +| Pnom_Ap | 20430 | Apos_Pa | 132 
-| ExD_Ap |  87377 +| Pnom_Co | 202656 AuxV_Co 131 
-| ExD_Co |  911226 +| Pred | 4593183 | AuxK_Pa | 61 
-| ExD_Pa |  229260 +| Pred_Ap | 20085 | AtvV_Pa | 44 
-| Obj |  10461705 | +| Pred_Co | 4567266 | AuxC_Co | 43 
-ObjAtr |  29 +| Pred_Pa | 94500 | AtrObj | 30 
-ObjAtr_Co  271 +| Sb | 7296792 | AuxG_Co | 26 
-Obj_Ap  94488 +| Sb_Ap | 232850 | AtrAdv_Ap | 7 
-Obj_Co  1192756 +| Sb_Co | 846484 ObjAtr | 
-| Obj_Pa |  379 + 
-| Pnom |  1687985 + --- //Tomáš Jelínek//
-| Pnom_Ap |  2902 +
-| Pnom_Co |  111903 | +
-Pnom_Pa |  41 +
-| Pred |  4912302 +
-| Pred_Ap |  20806 +
-| Pred_Co |  4860424 +
-| Pred_Pa |  80484 +
-| Sb |  6981795 +
-| Sb_Ap |  146866 +
-| Sb_Co |  956857 | +
-Sb_Pa |  180 |+