AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:afun [2015/12/17 10:27] vaclavcvrcekseznamy:afun [2022/12/16 16:18] (aktuální) jankrivan
Řádek 3: Řádek 3:
 Atributy **afun**, **p_afun**, **ep_afun** vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči ([[seznamy:parent|]]) či efektivnímu rodiči ([[seznamy:eparent|eparent]]). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce. Atributy **afun**, **p_afun**, **ep_afun** vyjadřují syntaktickou funkci přiřazenou danému tokenu, respektive jeho rodiči ([[seznamy:parent|]]) či efektivnímu rodiči ([[seznamy:eparent|eparent]]). Možné hodnoty těchto atributů jsou představeny v níže uvedené tabulce.
  
-Syntaktické funkce použité v korpusu SYN2015 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauer, předmět v PDT).+Syntaktické funkce použité v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2015|SYN2020]] vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např. u určení původce děje u opisného pasiva (příslovečné určení u Vl. Šmilauera, předmět v PDT).
  
 Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap.  Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap. 
Řádek 35: Řádek 35:
  
 Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap.
 +V korpusu SYN2020 se v důsledku pozdě zjištěné chyby parseru vyskytuje i syntaktická funkce _<PAD>, jež v koncepci PDT není. Vždy jde o chybu.
  
  
Řádek 40: Řádek 41:
  
  
-Seznam značek a jejich frekvence v korpusu SYN2015.+Seznam značek a jejich frekvence v korpusu [[cnk:syn2020|SYN2020]].
  
 ^  Podle abecedy  ^^  Podle frekvence  ^^ ^  Podle abecedy  ^^  Podle frekvence  ^^
-^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ Hodnota afun ^ Frekvence v korpusu SYN2015 +^ Hodnota afun ^ Frekvence v korpusu SYN2020 ^ Hodnota afun ^ Frekvence v korpusu SYN2020 
-| Adv | 13710363 | Atr | 24859249 +| Adv | 13606122 | Atr | 24027588 
-AdvAtr 74 | Adv | 13710363 +Adv_Ap 118237 | Adv | 13606122 
-AdvAtr_Ap 14 | AuxP | 10794852 +Adv_Co 972500 | AuxP | 10895181 
-AdvAtr_Co 309 | Obj | 10461705 +Adv_Pa 34429 | Obj | 9850532 
-Adv_Ap 31288 | AuxK | 7837441 +AdvAtr 150 | AuxK | 7394997 
-Adv_C 39 AuxX 7007444 +Apos 423898 Sb 7296792 
-Adv_Co 596299 Sb 6981795 +Apos_Ap 5506 AuxX 6723864 
-Adv_Pa 18158 | Coord | 4992966 +Apos_Co 29803 | Coord | 5157496 
-Apos 334041 | Pred | 4912302 +Apos_Pa 132 | Pred | 4593183 
-Apos_Ap 2440 | Pred_Co | 4860424 +Atr 24027588 | Pred_Co | 4567266 
-Apos_Co 31269 | AuxG | 3402843 +Atr_Ap 152154 | AuxG | 3562591 
-Apos_Pa 262 | AuxC | 2522491 +Atr_Co 2385027 | AuxC | 2588938 
-Atr 24859249 AuxT 2497283 +Atr_Pa 34650 Atr_Co 2385027 
-| AtrAdv | 307 Atr_Co 2101018 +| AtrAdv | 3144 AuxT 2355457 
-| AtrAdv_Ap | 72 AuxZ 1852858 +| AtrAdv_Ap | ExD 2306191 
-| AtrAdv_Co | 740 ExD 1747132 +| AtrAdv_Co | 2808 AuxV 1971742 
-AtrAdv_Pa 93 Pnom 1687985 +AtrAtr 309 AuxZ 1869287 
-AtrAtr 34 AuxV 1668548 +AtrObj 30 Pnom 1699987 
-AtrAtr_Ap | Obj_Co | 1192756 +Atv 175450 | Obj_Co | 1548946 
-AtrAtr_Co | 263 | Sb_Co | 956857 | +Atv_Ap 607 | ExD_Co | 1537005 
-| AtrAtr_Pa 11 | ExD_Co | 911226 +Atv_Co 15834 | Adv_Co | 972500 
-AtrObj | 57 | AuxY | 905768 | +Atv_Pa 326 AuxY 938455 
-| AtrObj_Co 229 | Adv_Co | 596299 +| AtvV | 155644 Sb_Co 846484 
-Atr_Ap 117568 Coord_Co 364706 | +| AtvV_Ap | 453 Coord_Co 543552 
-| Atr_Co | 2101018 | Apos | 334041 | +| AtvV_Co | 12147 Apos 423898 
-| Atr_Pa | 19682 | ExD_Pa | 229260 | +| AtvV_Pa | 44 ExD_Pa 299692 
-| Atv | 177471 | Atv | 177471 +| AuxC | 2588938 AuxR 275486 
-| AtvV | 119332 AuxR 171594 +| AuxC_Co | 43 Sb_Ap 232850 
-| AtvV_Ap | 73 Sb_Ap 146866 +| AuxG | 3562591 Pnom_Co 202656 
-| AtvV_Co | 705 AtvV 119332 +| AuxG_Co | 26 Atv 175450 
-| AtvV_Pa | 90 Atr_Ap 117568 | +| AuxG_Pa | 267 AtvV 155644 
-| Atv_Ap | 254 | Pnom_Co | 111903 | +| AuxK | 7394997 Atr_Ap 152154 
-| Atv_Co | 5077 | Obj_Ap | 94488 | +| AuxK_Pa | 61 Obj_Ap 144558 
-| Atv_Pa | 265 | ExD_Ap | 87377 +| AuxO | 56266 ExD_Ap 121129 
-| AuxC | 2522491 Pred_Pa 80484 | +| AuxP | 10895181 Adv_Ap 118237 
-| AuxC_Ap | 2 | Coord_Ap | 55677 +| AuxR | 275486 Coord_Ap 95230 
-| AuxC_Co | 60 Coord_Pa 41505 | +| AuxT | 2355457 Pred_Pa 94500 
-| AuxC_Pa | 46 | Adv_Ap | 31288 +| AuxV | 1971742 Coord_Pa 74753 
-| AuxG | 3402843 Apos_Co 31269 | +| AuxV_Co | 131 AuxO 56266 
-| AuxG_Ap | 14 | Pred_Ap | 20806 +| AuxX | 6723864 Atr_Pa 34650 
-| AuxG_Co | 330 Atr_Pa 19682 +| AuxY | 938455 Adv_Pa 34429 
-| AuxG_Pa | 489 Adv_Pa 18158 +| AuxY_Pa | 5898 Apos_Co 29803 
-| AuxK | 7837441 AuxO 12422 +| AuxZ | 1869287 Pnom_Ap 20430 
-| AuxK_Pa | 67 AuxY_Pa 5539 +| AuxZ_Co | 2075 Pred_Ap 20085 
-| AuxO | 12422 Atv_Co 5077 +| AuxZ_Pa | 306 Atv_Co 15834 
-| AuxP | 10794852 Pnom_Ap 2902 | +| Coord | 5157496 AtvV_Co 12147 
-| AuxP_Pa | 59 | Apos_Ap | 2440 +| Coord_Ap | 95230 AuxY_Pa 5898 
-| AuxR | 171594 AuxZ_Co 790 +| Coord_Co | 543552 Apos_Ap 5506 
-| AuxT | 2497283 AtrAdv_Co 740 | +| Coord_Pa | 74753 AtrAdv 3144 
-| AuxT_Pa | 12 | AtvV_Co | 705 +| ExD | 2306191 AtrAdv_Co 2808 
-| AuxV | 1668548 AuxG_Pa 489 +| ExD_Ap | 121129 AuxZ_Co 2075 
-| AuxV_Co | 67 Obj_Pa 379 +| ExD_Co | 1537005 Atv_Ap 607 
-| AuxX | 7007444 AuxG_Co 330 +| ExD_Pa | 299692 | AtvV_Ap | 453 
-| AuxY | 905768 AdvAtr_Co 309 | +| Obj | 9850532 Atv_Pa 326 
-| AuxY_Co | 7 | AtrAdv | 307 +Obj_Ap 144558 AtrAtr 309 
-| AuxY_Pa | 5539 ObjAtr_Co 271 +Obj_Co 1548946 AuxZ_Pa 306 
-| AuxZ | 1852858 Atv_Pa 265 +Obj_Pa 151 AuxG_Pa 267 
-| AuxZ_Co | 790 AtrAtr_Co 263 +ObjAtr | Obj_Pa | 151 
-| AuxZ_Pa | 251 Apos_Pa 262 +| Pnom | 1699987 AdvAtr 150 
-| Coord | 4992966 Atv_Ap 254 +| Pnom_Ap | 20430 Apos_Pa 132 
-| Coord_Ap | 55677 AuxZ_Pa 251 +| Pnom_Co | 202656 AuxV_Co 131 
-| Coord_Co | 364706 AtrObj_Co 229 +| Pred | 4593183 AuxK_Pa 61 
-| Coord_Pa | 41505 Sb_Pa 180 +| Pred_Ap | 20085 AtvV_Pa 44 
-| ExD | 1747132 AtrAdv_Pa 93 +| Pred_Co | 4567266 AuxC_Co 43 
-| ExD_Ap | 87377 AtvV_Pa 90 +| Pred_Pa | 94500 AtrObj 30 
-| ExD_Co | 911226 AdvAtr 74 +| Sb | 7296792 AuxG_Co 26 
-| ExD_Pa | 229260 | AtvV_Ap | 73 +| Sb_Ap | 232850 AtrAdv_Ap 
-| Obj | 10461705 AtrAdv_Ap 72 +| Sb_Co | 846484 ObjAtr |
-ObjAtr 29 AuxK_Pa 67 +
-ObjAtr_Co 271 AuxV_Co 67 +
-Obj_Ap 94488 AuxC_Co 60 +
-Obj_Co 1192756 | AuxP_Pa | 59 | +
-| Obj_Pa | 379 | AtrObj | 57 +
-| Pnom | 1687985 AuxC_Pa 46 +
-| Pnom_Ap | 2902 Pnom_Pa 41 +
-| Pnom_Co | 111903 Adv_C 39 | +
-| Pnom_Pa | 41 | AtrAtr | 34 +
-| Pred | 4912302 ObjAtr 29 +
-| Pred_Ap | 20806 AdvAtr_Ap 14 +
-| Pred_Co | 4860424 AuxG_Ap 14 +
-| Pred_Pa | 80484 AuxT_Pa 12 +
-| Sb | 6981795 AtrAtr_Pa 11 +
-| Sb_Ap | 146866 AtrAtr_Ap +
-| Sb_Co | 956857 AuxY_Co | 7 | +
-| Sb_Pa | 180 | AuxC_Ap |+
  
  --- //Tomáš Jelínek//  --- //Tomáš Jelínek//