AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:syntakticke_znacky [2015/12/14 15:27] tomasjelinekseznamy:syntakticke_znacky [2016/10/17 13:04] (aktuální) michalkren
Řádek 1: Řádek 1:
-====== Syntaktické značky (atributy: afun, p_afun a ep_afun) ======+====== Syntaktické značky ======
  
-Syntaktické značky+[[pojmy:syntakticka_analyza|Syntaktická anotace]] použitá v některých korpusech ČNK (např. v [[cnk:syn2015|SYN2015]]) vychází z koncepce anotace na tzv. analytické rovině [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Pražského závislostního korpusu]] (PDT). Základními atributy, do nichž je syntaktická analýza zakódována, jsou: 
 +  * [[seznamy:afun|afun, p_afun, ep_afun]]: u každého tokenu uvádí syntaktickou funkci podle [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|analytické roviny PDT]] 
 +  * [[seznamy:parent|parent]]: relativní pozice tokenu, na němž je daný token závislý 
 +  * [[seznamy:eparent|eparent]]: pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý (přeskakuje předložky, spojky ap.) 
 +  * [[seznamy:p_tag|p_tag, p_lemma]]: tag a lemma řídícího tokenu  
 +  * [[seznamy:p_tag|ep_tag, ep_lemma]]: totéž jako ''p_tag'' a ''p_lemma'', ale pouze u autosémantických slov  
 +  * [[seznamy:prep|prep]]: u jmen řízených předložkou uvádí lemma předložky
  
-Syntaktické značky použité v korpusu SYN2015 vycházejí z koncepce anotace na tzv. analytické rovině Pražského závislostního korpusu ([[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|PDT]]). Tato koncepce navazuje na práci Vl. Šmilauera, v mnohém tak definice jednotlivých funkcí odpovídají definicím v Novočeské skladbě; v některých případech je ale pojetí odlišné, např.  + --- //Tomáš Jelínek//
- +
-Syntaktické funkce lze rozdělit na základní (běžně užívané): přísudek (Pred), jmenná část verbonominálního přísudku (Pnom), podmět (Sb), přívlastek (Atr), předmět (Obj), příslovečné určení (Adv), doplněk (Atv, resp. AtvV), a na pomocné funkce, přiřazené např. pomocnému slovesu, předložkám, spojkám, grafickým symbolům ap.  +
-Přísudky ve vedlejších větách dostávají syntaktickou funkci věty, kterou reprezentují, tj. přísudek ve vedlejší větě předmětné bude mít funkci Obj, ne Pred. +
- +
-V následující tabulce uvádíme všechny syntaktické funkce spolu s odkazem na [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/index.html|Anotační manuál PDT]]. +
- +
-^ Syntaktická funkce ^ Definice ^ Poznámka ^ +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pred]] | Predikát (přísudek)  | pouze v hlavní větě | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s02.html|Sb]] | Subjekt (podmět) |  | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s04.html|Obj]] | Objekt (předmět) | včetně určení činitele děje u opisného pasiva | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s05.html|Adv]] | Adverbiale (příslovečné určení) | bez dalšího rozlišení, vč. předložkových pádů u slovesa //být//, některých volných dativů aj. | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|Atv]] | Doplněk | jen tzv. určující; technicky zavěšen na neslovesném členu | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s06.html|AtvV]] | Doplněk | jen tzv. určující; visící na slovese (ve větě není vyjádřen druhý řídící člen) | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s03.html|Atr]] | Atribut (přívlastek) | včetně spojení typu //*Jan* Novák//, genitivu po číslovkách aj. | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|Pnom]] | Jmenná část verbonom. přísudku se sponou //být, bývat// | mimo předložkové pády | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03.html#X_4_2_1_prisudek_predikat_pred_pnom_auxv_|AuxV]] | Pomocné sloveso //být// (Auxiliary Verb) | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05.html#X_4_4_1_koordinace_vetna_i_vetneclenska_coord_afun_Co_|Coord]] | Koordinační uzel (souřadné spojení) | souřadicí spojka nebo interpunkce | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s05s02.html|Apos]] | Aposice (hlavní uzel) | spojovací slovo nebo interpunkční znaménko | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s05.html|AuxT]] | Zvratné se u refl. tantum | neoddělitelné se – reflexivní tantum | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s06.html|AuxR]] | Zvratné se u pasiva | zvratné se, které není Obj ani AuxT (tvoří pasivum reflexivní) | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s02.html|AuxP]] | Předložka | popř. všechny části složené předložky | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07.html|AuxC]] | Spojka podřadicí | | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s04.html|AuxO]] | Nadbytečný (odkazovací, emotivní) element | např. etické //ti// | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s03.html|AuxZ]] | Zdůrazňovací slovo | | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s08s03.html|AuxX]] | Čárka | ne však nositel koordinace nebo koncový symbol | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s08s04.html|AuxG]] | Jiné grafické symboly, které neukončují větu | | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s07s07.html|AuxY]] | Příslovce a částice, které nelze zařadit jinam | | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s03s08s02.html|AuxK]] | Koncová interpunkce věty | | +
-| [[http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/a-layer/html/ch03s04.html|ExD]] | Součást aktuální elipsy | náhradní funkce pro technické hrany vedoucí místo od elidovaného členu k "pseudořídícímu" slovu nebo pro hlavní člen věty bez predikátu (Ex-Dependent); také ve srovnávacích spojeních typu //zdravý jako ryba// | +
- +
-Každé syntaktické funkci lze zároveň přiřadit jednu z následujících koncovek: _Co, _Ap, _Pa, a to u tokenů, které jsou koordinované, v apozičním vztahu nebo součástí parenteze. Koordinovaným přívlastkům se tak například přiřazuje funkce Atr_Co, podmětům v apozičním vztahu se přiřadí funkce Sb_Ap. +
- +
- +
-Seznam značek a jejich frekvence v korpusu SYN2015. +
- +
-^ Hodnota afun ^ Frekvence v korpusu SYN2015 ^ +
-| Adv |  13710363 | +
-| AdvAtr |  74 | +
-| AdvAtr_Ap |  14 | +
-| AdvAtr_Co |  309 | +
-| Adv_Ap |  31288 | +
-| Adv_C |  39 | +
-| Adv_Co |  596299 | +
-| Adv_Pa |  18158 | +
-| Apos |  334041 | +
-| Apos_Ap |  2440 | +
-| Apos_Co |  31269 | +
-| Apos_Pa |  262 | +
-| Atr |  24859249 | +
-| AtrAdv |  307 | +
-| AtrAdv_Ap |  72 | +
-| AtrAdv_Co |  740 | +
-| AtrAdv_Pa |  93 | +
-| AtrAtr |  34 | +
-| AtrAtr_Ap |  8 | +
-| AtrAtr_Co |  263 | +
-| AtrAtr_Pa |  11 | +
-| AtrObj |  57 | +
-| AtrObj_Co |  229 | +
-| Atr_Ap |  117568 | +
-| Atr_Co |  2101018 | +
-| Atr_Pa |  19682 | +
-| Atv |  177471 | +
-| AtvV |  119332 | +
-| AtvV_Ap |  73 | +
-| AtvV_Co |  705 | +
-| AtvV_Pa |  90 | +
-| Atv_Ap |  254 | +
-| Atv_Co |  5077 | +
-| Atv_Pa |  265 | +
-| AuxC |  2522491 | +
-| AuxC_Ap |  2 | +
-| AuxC_Co |  60 | +
-| AuxC_Pa |  46 | +
-| AuxG |  3402843 | +
-| AuxG_Ap |  14 | +
-| AuxG_Co |  330 | +
-| AuxG_Pa |  489 | +
-| AuxK |  7837441 | +
-| AuxK_Pa |  67 | +
-| AuxO |  12422 | +
-| AuxP |  10794852 | +
-| AuxP_Pa |  59 | +
-| AuxR |  171594 | +
-| AuxT |  2497283 | +
-| AuxT_Pa |  12 | +
-| AuxV |  1668548 | +
-| AuxV_Co |  67 | +
-| AuxX |  7007444 | +
-| AuxY |  905768 | +
-| AuxY_Co |  7 | +
-| AuxY_Pa |  5539 | +
-| AuxZ |  1852858 | +
-| AuxZ_Co |  790 | +
-| AuxZ_Pa |  251 | +
-| Coord |  4992966 | +
-| Coord_Ap |  55677 | +
-| Coord_Co |  364706 | +
-| Coord_Pa |  41505 | +
-| ExD |  1747132 | +
-| ExD_Ap |  87377 | +
-| ExD_Co |  911226 | +
-| ExD_Pa |  229260 | +
-| Obj |  10461705 | +
-| ObjAtr |  29 | +
-| ObjAtr_Co |  271 | +
-| Obj_Ap |  94488 | +
-| Obj_Co |  1192756 | +
-| Obj_Pa |  379 | +
-| Pnom |  1687985 | +
-| Pnom_Ap |  2902 | +
-| Pnom_Co |  111903 | +
-| Pnom_Pa |  41 | +
-| Pred |  4912302 | +
-| Pred_Ap |  20806 | +
-| Pred_Co |  4860424 | +
-| Pred_Pa |  80484 | +
-| Sb |  6981795 | +
-| Sb_Ap |  146866 | +
-| Sb_Co |  956857 | +
-| Sb_Pa |  180 |+