AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:verbtagy_detail [2022/02/08 17:29] – [Víceslovné slovesné tvary z hlediska syntaxe a automatického značkování] vladmirpetkevicseznamy:verbtagy_detail [2022/11/18 12:53] (aktuální) – [Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování] jankrivan
Řádek 1: Řádek 1:
 ======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování====== ======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování======
  
-V tomto detailním přehledu nejprve popíšeme, které morfologické kategorie a jejich hodnoty v atributu //verbtag// zachycujeme a kterým slovním tvarům jsou tyto údaje připisovány. Poté předvádíme na příkladech, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec stručně popíšeme některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování.+V tomto detailním přehledu je nejprve uvedeno, které morfologické kategorie a jejich hodnoty v atributu //verbtag// se při značkování zachycují a kterým slovním tvarům jsou tyto údaje připisovány. Poté se na příkladech předvádí, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec jsou stručně popsány některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování.
  
 Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní). Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní).
Řádek 7: Řádek 7:
 Atribut verbtag tedy přenáší hodnoty některých gramatických kategorií od tvarů pomocného slovesa //být// ke slovesu plnovýznamovému, výjimečně i od zájmen (například tam, kde je osoba vyjádřena jen osobním zájmenem, nikoli slovesným tvarem: //já nemohl spát//). Nepřenáší však hodnoty gramatických kategorií od jiných sloves, například od sloves modálních či fázových, např. infinitiv po modálním slovese tedy bude mít pro osobu a číslo hodnotu „%%-%%“ (irelevantní). Atribut verbtag tedy přenáší hodnoty některých gramatických kategorií od tvarů pomocného slovesa //být// ke slovesu plnovýznamovému, výjimečně i od zájmen (například tam, kde je osoba vyjádřena jen osobním zájmenem, nikoli slovesným tvarem: //já nemohl spát//). Nepřenáší však hodnoty gramatických kategorií od jiných sloves, například od sloves modálních či fázových, např. infinitiv po modálním slovese tedy bude mít pro osobu a číslo hodnotu „%%-%%“ (irelevantní).
  
-Při určování gramatických kategorií daného tvaru atribut verbtag více využívá okolního kontextu a je interpretativnější než základní 15poziční morfologický tag. Například u příčestí neobsahuje tag kategorii osoby (samo izolované příčestí osobu nevyjadřuje, typ //slyšels// je pojednán jako agregát, tedy víceslovný token), zato verbtag osobu určuje. Imperativ může mít v tagu pouze první či druhou osobu (//chraňme//, //chraň//, //chraňte//), ve verbtagu může ale v určitých kontextech nabýt i osoby třetí (//chraň Bůh//). Rozpor mezi číslem u pomocného slovesa a u příčestí v případě vykání (a pouze v ípadě vykání, ne v jiných případech) je zachycen hodnotou **v** pro gramatickou kategorii čísla ve verbtagu: například ve spojení //abyste nepřišla// bude mít příčestí //nepřišla// číslo v tagu hodnotu **S** (singulár), ve verbtagu hodnotu **v** (vykání).+Při určování gramatických kategorií daného tvaru atribut verbtag více využívá okolního kontextu a je interpretativnější než základní 15poziční morfologický tag. Například u příčestí neobsahuje tag kategorii osoby (samo izolované příčestí osobu nevyjadřuje, typ //slyšels// je pojednán jako agregát, tedy víceslovný token), zato verbtag osobu určuje. Imperativ může mít v tagu pouze první či druhou osobu (//chraňme//, //chraň//, //chraňte//), ve verbtagu může ale v určitých kontextech nabýt i osoby třetí (//chraň Bůh//). Rozpor mezi číslem u pomocného slovesa a u příčestí (týká se edevším vykání) je zachycen hodnotou **v** pro gramatickou kategorii čísla ve verbtagu: například ve spojení //abyste nepřišla// bude mít příčestí //nepřišla// číslo v tagu hodnotu **S** (singulár), ve verbtagu hodnotu **v** (vykání).
  
  
-Nyní uvedeme nejprve přehledově a poté podrobně obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami:+V této části je nejprve přehledově a poté podrobně popsán obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami:
  
  
Řádek 64: Řádek 64:
  
 Hodnotu V mají: Hodnotu V mají:
-   * tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež chápeme jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i:+   * tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež se při značkování chápou jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i:
      * sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//.      * sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//.
      * sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//.      * sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//.
Řádek 97: Řádek 97:
  
  
-====2. pozice – slovesný způsob====+====2. pozice – typ slovesného tvaru====
  
 možné hodnoty: **D** / **C** / **I** / **F** / **T** / **O** / %%-%% (indikativ / kondicionál / imperativ / infinitiv / přechodník / ostatní funkce trpného příčestí (doplněk nebo predikát bez spony) / irelevantní) možné hodnoty: **D** / **C** / **I** / **F** / **T** / **O** / %%-%% (indikativ / kondicionál / imperativ / infinitiv / přechodník / ostatní funkce trpného příčestí (doplněk nebo predikát bez spony) / irelevantní)
Řádek 130: Řádek 130:
  
  
-Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... chápeme jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...:+Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... se chápou jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...:
    * //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý//    * //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý//
  
Řádek 176: Řádek 176:
  
  
-Ve verbtagu nezachycujeme reflexivní diatezi (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm nezachycujeme reflexivní pasivum, značkujeme pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční.+Ve verbtagu není zachycena reflexivní diateze (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm není zachyceno reflexivní pasivum, značkuje se pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční.
  
  
Řádek 202: Řádek 202:
      * a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel//      * a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel//
  
-Na 4. pozici verbtagu zachycujeme také sémanticky třetí osobu imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje.+Na 4. pozici verbtagu je vyjádřena i sémanticky třetí osoba imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje.
  
  
Řádek 290: Řádek 290:
 Hodnotu Q mají: Hodnotu Q mají:
      * aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q      * aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q
-     * tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu jsme ji nenalezli.+     * tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu nebyla nalezena.
  
 Čas se neuvádí (jeho hodnota je tedy: %%-%%): Čas se neuvádí (jeho hodnota je tedy: %%-%%):
Řádek 364: Řádek 364:
 =====Příklady značkování atributem verbtag===== =====Příklady značkování atributem verbtag=====
  
-Aby se čtenář v popisu víceslovných predikátů, který jsme právě představili, lépe orientoval, uvádíme v této části řadu ilustrativních příkladů vět z korpusů SYN2020 a SYNv9.+Aby se čtenář v právě představeném popisu víceslovných predikátů lépe orientoval, je v této části uvedena řada ilustrativních příkladů vět z korpusů SYN2020 a SYNv9.
  
  
Řádek 382: Řádek 382:
  
  
-Věta (2) neobsahuje opisné futurum, neboť ve vedlejší větě je //neříkat// infinitivní tvar ve funkci podmětu. Indikativní (**D**) tvar //bude// 3. osoby singuláru (**S**) futura (**F**) aktiva (**A**) je tedy spona (**V**, nepomocný slovesný tvar). U plnovýznamového (**V**) jednoslovného záporného infinitivního tvaru //neříkat// určujeme opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**); negace je vyjádřena v tagu (viz podrobněji v části 2.3). Tak jako ve větě (1) je všem ostatním slovním tvarům formálně přiřazen tento atribut s irelevantními hodnotami jednotlivých kategorií: //nejlepší///%%------%%, //nic///%%------%%, tečka/%%------%%.+Věta (2) neobsahuje opisné futurum, neboť ve vedlejší větě je //neříkat// infinitivní tvar ve funkci podmětu. Indikativní (**D**) tvar //bude// 3. osoby singuláru (**S**) futura (**F**) aktiva (**A**) je tedy spona (**V**, nepomocný slovesný tvar). U plnovýznamového (**V**) jednoslovného záporného infinitivního tvaru //neříkat// se určuje opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**); negace je vyjádřena v tagu (viz podrobněji v části 2.3). Tak jako ve větě (1) je všem ostatním slovním tvarům formálně přiřazen tento atribut s irelevantními hodnotami jednotlivých kategorií: //nejlepší///%%------%%, //nic///%%------%%, tečka/%%------%%.
  
  
Řádek 392: Řádek 392:
  
  
-V uvedené větě je plnovýznamový (**V**) finitní tvar //chceš// v 2. osobě singuláru (**S**) indikativu (**D**) prézentu (**P**) aktiva (**A**); u plnovýznamového jednoslovného infinitivního tvaru //dokázat// určujeme opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**).+V uvedené větě je plnovýznamový (**V**) finitní tvar //chceš// v 2. osobě singuláru (**S**) indikativu (**D**) prézentu (**P**) aktiva (**A**); u plnovýznamového jednoslovného infinitivního tvaru //dokázat// je určen opět pouze způsob, tedy infinitiv (**F**), a aktivní diateze (**A**).
  
  
Řádek 422: Řádek 422:
  
  
-Na počátku věty (6) vidíme složený slovesný tvar //přál jsem// s plnovýznamovým tvarem //přál// (verbtag: indikativ – **D**, aktivum – **A**, 1. osoba, singulár – **S**, minulý čas – **R**) a pomocným (**A**) tvarem //jsem//; dále je ve větě tvar aktivního infinitivu //představit//.+Na počátku věty (6) je složený slovesný tvar //přál jsem// s plnovýznamovým tvarem //přál// (verbtag: indikativ – **D**, aktivum – **A**, 1. osoba, singulár – **S**, minulý čas – **R**) a pomocným (**A**) tvarem //jsem//; dále je ve větě tvar aktivního infinitivu //představit//.
  
  
Řádek 432: Řádek 432:
  
  
-Ve větě (7) vyznačujeme vlastnosti pasivní konstrukce //byla nalezena// u plnovýznamového trpného příčestí //nalezena//: tj. indikativ (**D**), pasivní diateze (**P**), 3. osoba plurálu (**P**) a minulý čas (**R**); tvar //byla// je tvarem pomocného slovesa (proto **A**).+Ve větě (7) jsou vyznačeny vlastnosti pasivní konstrukce //byla nalezena// u plnovýznamového trpného příčestí //nalezena//: tj. indikativ (**D**), pasivní diateze (**P**), 3. osoba plurálu (**P**) a minulý čas (**R**); tvar //byla// je tvarem pomocného slovesa (proto **A**).
  
  
Řádek 442: Řádek 442:
  
  
-V této větě nacházíme (i) víceslovný slovesný tvar //nakopal bych//, což je aktivní (**A**) konstrukce přítomného (**P**) kondicionálu (**C**) v 1. osobě singuláru (**S**); (ii) víceslovný slovesný tvar //jsem// … //začal//, což je aktivní (**A**) konstrukce 3. osoby singuláru (**S**) indikativu (**D**) minulého času (**R**).+V této větě se nachází (i) víceslovný slovesný tvar //nakopal bych//, což je aktivní (**A**) konstrukce přítomného (**P**) kondicionálu (**C**) v 1. osobě singuláru (**S**); (ii) víceslovný slovesný tvar //jsem// … //začal//, což je aktivní (**A**) konstrukce 3. osoby singuláru (**S**) indikativu (**D**) minulého času (**R**).
  
  
Řádek 516: Řádek 516:
 (i) //bych// … //přál//, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) 1. osoby singuláru (S) (i) //bych// … //přál//, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) 1. osoby singuláru (S)
  
-(ii) //abych// … //byl býval rozhodl//, což je aktivní (A) konstrukce minulého (R) kondicionálu (C) 1. osoby singuláru (S). Tvar //abych// je značkován jako dvojice //aby// – //bych//, přičemž každá složka (tedy //aby// a //bych//) má své lemma (//aby//, resp. //být//), tag i verbtag. Verbtag tvaru složky //aby// (spojka) je irelevantní (%%------%%), tvar //bych// značkujeme jako pomocný (A%%-----%%). Pomocné (A) jsou i tvary //byl// a //býval//, takže veškeré údaje morfologicky charakterizující celý komplex //abych// … //byl býval rozhodl// jsou vyjádřeny u plnovýznamového tvaru //rozhodl//: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S). +(ii) //abych// … //byl býval rozhodl//, což je aktivní (A) konstrukce minulého (R) kondicionálu (C) 1. osoby singuláru (S). Tvar //abych// je značkován jako dvojice //aby// – //bych//, přičemž každá složka (tedy //aby// a //bych//) má své lemma (//aby//, resp. //být//), tag i verbtag. Verbtag tvaru složky //aby// (spojka) je irelevantní (%%------%%), tvar //bych// se značkuje jako pomocný (A%%-----%%). Pomocné (A) jsou i tvary //byl// a //býval//, takže veškeré údaje morfologicky charakterizující celý komplex //abych// … //byl býval rozhodl// jsou vyjádřeny u plnovýznamového tvaru //rozhodl//: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S). 
  
  
Řádek 556: Řádek 556:
  
  
-Ve větě (19) je ortografické slovo //ses//, které při značkování dělíme na dvě části: reflexivum //se// a //s// (enklitická varianta tvaru //jsi//). Každá část obdrží při značkování své lemma (//se//, resp. //být//), dále tag a verbtag (%%------%%, tj. irelevantní pro první část, tj. reflexivum //se//; A%%-----%% pro část druhou, tj. //s//); //s// je zde totiž v pomocné funkci – spolutvoří 2. osobu singuláru přítomného kondicionálu //měla by// %%-%%//s//. Tyto a další hodnoty morfologických kategorií jsou uvedeny u plnovýznamového tvaru //měla//.+Ve větě (19) se nachází ortografické slovo //ses//, které se při značkování dělí na dvě části: reflexivum //se// a //s// (enklitická varianta tvaru //jsi//). Každá část obdrží při značkování své lemma (//se//, resp. //být//), dále tag a verbtag (%%------%%, tj. irelevantní pro první část, tj. reflexivum //se//; A%%-----%% pro část druhou, tj. //s//); //s// je zde totiž v pomocné funkci – spolutvoří 2. osobu singuláru přítomného kondicionálu //měla by// %%-%%//s//. Tyto a další hodnoty morfologických kategorií jsou uvedeny u plnovýznamového tvaru //měla//.
  
  
Řádek 646: Řádek 646:
  
  
-V rezultativní konstrukci //mám vymeteno// vyjadřujeme symbolem O (= ostatní funkce trpného příčestí) hodnotu kategorie způsob (2. pozice verbtagu) u plnovýznamového tvaru //vymeteno//.+V rezultativní konstrukci //mám vymeteno// se symbolem O (= ostatní funkce trpného příčestí) vyjadřuje hodnota kategorie způsob (2. pozice verbtagu) u plnovýznamového tvaru //vymeteno//.