Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
seznamy:verbtagy_detail [2022/02/08 17:29] – [Víceslovné slovesné tvary z hlediska syntaxe a automatického značkování] vladmirpetkevic | seznamy:verbtagy_detail [2022/02/08 17:42] – [Příklady značkování atributem verbtag] vladmirpetkevic |
---|
======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování====== | ======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování====== |
| |
V tomto detailním přehledu nejprve popíšeme, které morfologické kategorie a jejich hodnoty v atributu //verbtag// zachycujeme a kterým slovním tvarům jsou tyto údaje připisovány. Poté předvádíme na příkladech, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec stručně popíšeme některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování. | V tomto detailním přehledu je nejprve uvedeno, které morfologické kategorie a jejich hodnoty v atributu //verbtag// se při značkování zachycují a kterým slovním tvarům jsou tyto údaje připisovány. Poté se na příkladech předvádí, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec jsou stručně popsány některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování. |
| |
Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní). | Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní). |
| |
| |
Nyní uvedeme nejprve přehledově a poté podrobně obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami: | V této části je nejprve přehledově a poté podrobně popsán obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami: |
| |
| |
| |
Hodnotu V mají: | Hodnotu V mají: |
* tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež chápeme jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i: | * tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež se při značkování chápou jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i: |
* sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//. | * sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//. |
* sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//. | * sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//. |
| |
| |
Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... chápeme jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...: | Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... se chápou jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...: |
* //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý// | * //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý// |
| |
| |
| |
Ve verbtagu nezachycujeme reflexivní diatezi (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm nezachycujeme reflexivní pasivum, značkujeme pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční. | Ve verbtagu není zachycena reflexivní diateze (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm není zachyceno reflexivní pasivum, značkuje se pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční. |
| |
| |
* a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel// | * a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel// |
| |
Na 4. pozici verbtagu zachycujeme také sémanticky třetí osobu imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje. | Na 4. pozici verbtagu je vyjádřena i sémanticky třetí osoba imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje. |
| |
| |
Hodnotu Q mají: | Hodnotu Q mají: |
* aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q | * aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q |
* tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu jsme ji nenalezli. | * tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu nebyla nalezena. |
| |
Čas se neuvádí (jeho hodnota je tedy: %%-%%): | Čas se neuvádí (jeho hodnota je tedy: %%-%%): |
=====Příklady značkování atributem verbtag===== | =====Příklady značkování atributem verbtag===== |
| |
Aby se čtenář v popisu víceslovných predikátů, který jsme právě představili, lépe orientoval, uvádíme v této části řadu ilustrativních příkladů vět z korpusů SYN2020 a SYNv9. | Aby se čtenář v právě představeném popisu víceslovných predikátů lépe orientoval, je v této části uvedena řada ilustrativních příkladů vět z korpusů SYN2020 a SYNv9. |
| |
| |
| |
| |
Věta (2) neobsahuje opisné futurum, neboť ve vedlejší větě je //neříkat// infinitivní tvar ve funkci podmětu. Indikativní (**D**) tvar //bude// 3. osoby singuláru (**S**) futura (**F**) aktiva (**A**) je tedy spona (**V**, nepomocný slovesný tvar). U plnovýznamového (**V**) jednoslovného záporného infinitivního tvaru //neříkat// určujeme opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**); negace je vyjádřena v tagu (viz podrobněji v části 2.3). Tak jako ve větě (1) je všem ostatním slovním tvarům formálně přiřazen tento atribut s irelevantními hodnotami jednotlivých kategorií: //nejlepší///%%------%%, //nic///%%------%%, tečka/%%------%%. | Věta (2) neobsahuje opisné futurum, neboť ve vedlejší větě je //neříkat// infinitivní tvar ve funkci podmětu. Indikativní (**D**) tvar //bude// 3. osoby singuláru (**S**) futura (**F**) aktiva (**A**) je tedy spona (**V**, nepomocný slovesný tvar). U plnovýznamového (**V**) jednoslovného záporného infinitivního tvaru //neříkat// se určuje opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**); negace je vyjádřena v tagu (viz podrobněji v části 2.3). Tak jako ve větě (1) je všem ostatním slovním tvarům formálně přiřazen tento atribut s irelevantními hodnotami jednotlivých kategorií: //nejlepší///%%------%%, //nic///%%------%%, tečka/%%------%%. |
| |
| |
| |
| |
V uvedené větě je plnovýznamový (**V**) finitní tvar //chceš// v 2. osobě singuláru (**S**) indikativu (**D**) prézentu (**P**) aktiva (**A**); u plnovýznamového jednoslovného infinitivního tvaru //dokázat// určujeme opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**). | V uvedené větě je plnovýznamový (**V**) finitní tvar //chceš// v 2. osobě singuláru (**S**) indikativu (**D**) prézentu (**P**) aktiva (**A**); u plnovýznamového jednoslovného infinitivního tvaru //dokázat// je určen opět pouze způsob, tedy infinitiv (**F**), a aktivní diateze (**A**). |
| |
| |
| |
| |
Na počátku věty (6) vidíme složený slovesný tvar //přál jsem// s plnovýznamovým tvarem //přál// (verbtag: indikativ – **D**, aktivum – **A**, 1. osoba, singulár – **S**, minulý čas – **R**) a pomocným (**A**) tvarem //jsem//; dále je ve větě tvar aktivního infinitivu //představit//. | Na počátku věty (6) je složený slovesný tvar //přál jsem// s plnovýznamovým tvarem //přál// (verbtag: indikativ – **D**, aktivum – **A**, 1. osoba, singulár – **S**, minulý čas – **R**) a pomocným (**A**) tvarem //jsem//; dále je ve větě tvar aktivního infinitivu //představit//. |
| |
| |
| |
| |
Ve větě (7) vyznačujeme vlastnosti pasivní konstrukce //byla nalezena// u plnovýznamového trpného příčestí //nalezena//: tj. indikativ (**D**), pasivní diateze (**P**), 3. osoba plurálu (**P**) a minulý čas (**R**); tvar //byla// je tvarem pomocného slovesa (proto **A**). | Ve větě (7) jsou vyznačeny vlastnosti pasivní konstrukce //byla nalezena// u plnovýznamového trpného příčestí //nalezena//: tj. indikativ (**D**), pasivní diateze (**P**), 3. osoba plurálu (**P**) a minulý čas (**R**); tvar //byla// je tvarem pomocného slovesa (proto **A**). |
| |
| |
| |
| |
V této větě nacházíme (i) víceslovný slovesný tvar //nakopal bych//, což je aktivní (**A**) konstrukce přítomného (**P**) kondicionálu (**C**) v 1. osobě singuláru (**S**); (ii) víceslovný slovesný tvar //jsem// … //začal//, což je aktivní (**A**) konstrukce 3. osoby singuláru (**S**) indikativu (**D**) minulého času (**R**). | V této větě se nachází (i) víceslovný slovesný tvar //nakopal bych//, což je aktivní (**A**) konstrukce přítomného (**P**) kondicionálu (**C**) v 1. osobě singuláru (**S**); (ii) víceslovný slovesný tvar //jsem// … //začal//, což je aktivní (**A**) konstrukce 3. osoby singuláru (**S**) indikativu (**D**) minulého času (**R**). |
| |
| |
(i) //bych// … //přál//, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) 1. osoby singuláru (S) | (i) //bych// … //přál//, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) 1. osoby singuláru (S) |
| |
(ii) //abych// … //byl býval rozhodl//, což je aktivní (A) konstrukce minulého (R) kondicionálu (C) 1. osoby singuláru (S). Tvar //abych// je značkován jako dvojice //aby// – //bych//, přičemž každá složka (tedy //aby// a //bych//) má své lemma (//aby//, resp. //být//), tag i verbtag. Verbtag tvaru složky //aby// (spojka) je irelevantní (%%------%%), tvar //bych// značkujeme jako pomocný (A%%-----%%). Pomocné (A) jsou i tvary //byl// a //býval//, takže veškeré údaje morfologicky charakterizující celý komplex //abych// … //byl býval rozhodl// jsou vyjádřeny u plnovýznamového tvaru //rozhodl//: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S). | (ii) //abych// … //byl býval rozhodl//, což je aktivní (A) konstrukce minulého (R) kondicionálu (C) 1. osoby singuláru (S). Tvar //abych// je značkován jako dvojice //aby// – //bych//, přičemž každá složka (tedy //aby// a //bych//) má své lemma (//aby//, resp. //být//), tag i verbtag. Verbtag tvaru složky //aby// (spojka) je irelevantní (%%------%%), tvar //bych// se značkuje jako pomocný (A%%-----%%). Pomocné (A) jsou i tvary //byl// a //býval//, takže veškeré údaje morfologicky charakterizující celý komplex //abych// … //byl býval rozhodl// jsou vyjádřeny u plnovýznamového tvaru //rozhodl//: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S). |
| |
| |
| |
| |
Ve větě (19) je ortografické slovo //ses//, které při značkování dělíme na dvě části: reflexivum //se// a //s// (enklitická varianta tvaru //jsi//). Každá část obdrží při značkování své lemma (//se//, resp. //být//), dále tag a verbtag (%%------%%, tj. irelevantní pro první část, tj. reflexivum //se//; A%%-----%% pro část druhou, tj. //s//); //s// je zde totiž v pomocné funkci – spolutvoří 2. osobu singuláru přítomného kondicionálu //měla by// %%-%%//s//. Tyto a další hodnoty morfologických kategorií jsou uvedeny u plnovýznamového tvaru //měla//. | Ve větě (19) se nachází ortografické slovo //ses//, které se při značkování dělí na dvě části: reflexivum //se// a //s// (enklitická varianta tvaru //jsi//). Každá část obdrží při značkování své lemma (//se//, resp. //být//), dále tag a verbtag (%%------%%, tj. irelevantní pro první část, tj. reflexivum //se//; A%%-----%% pro část druhou, tj. //s//); //s// je zde totiž v pomocné funkci – spolutvoří 2. osobu singuláru přítomného kondicionálu //měla by// %%-%%//s//. Tyto a další hodnoty morfologických kategorií jsou uvedeny u plnovýznamového tvaru //měla//. |
| |
| |
| |
| |
V rezultativní konstrukci //mám vymeteno// vyjadřujeme symbolem O (= ostatní funkce trpného příčestí) hodnotu kategorie způsob (2. pozice verbtagu) u plnovýznamového tvaru //vymeteno//. | V rezultativní konstrukci //mám vymeteno// se symbolem O (= ostatní funkce trpného příčestí) vyjadřuje hodnota kategorie způsob (2. pozice verbtagu) u plnovýznamového tvaru //vymeteno//. |
| |
| |