AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:verbtagy_detail [2022/02/08 17:19] – [Příklady značkování atributem verbtag] vladmirpetkevicseznamy:verbtagy_detail [2022/11/18 12:53] (aktuální) – [Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování] jankrivan
Řádek 1: Řádek 1:
 ======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování====== ======Morfologické kategorie a hodnoty v atributu verbtag a jejich značkování======
  
-V tomto detailním přehledu nejprve popíšeme, které morfologické kategorie a jejich hodnoty v atributu //verbtag// zachycujeme a kterým slovním tvarům jsou tyto údaje připisovány. Poté předvádíme na příkladech, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec stručně popíšeme některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování.+V tomto detailním přehledu je nejprve uvedeno, které morfologické kategorie a jejich hodnoty v atributu //verbtag// se při značkování zachycují a kterým slovním tvarům jsou tyto údaje připisovány. Poté se na příkladech předvádí, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec jsou stručně popsány některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování.
  
 Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní). Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (//napíšu//, //slyšet//, //jsem//, //hovořil//), tak u tvarů složených (//budu psát//, //slyšeli jste//, //byli bychom připravili//, //být spasen//). Odlišuje také pomocné tvary slovesa //být/////býti// a //bývat/////bývati// od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na %%-%%//ný//, %%-%%//tý// (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „%%------%%“ (irelevantní).
Řádek 7: Řádek 7:
 Atribut verbtag tedy přenáší hodnoty některých gramatických kategorií od tvarů pomocného slovesa //být// ke slovesu plnovýznamovému, výjimečně i od zájmen (například tam, kde je osoba vyjádřena jen osobním zájmenem, nikoli slovesným tvarem: //já nemohl spát//). Nepřenáší však hodnoty gramatických kategorií od jiných sloves, například od sloves modálních či fázových, např. infinitiv po modálním slovese tedy bude mít pro osobu a číslo hodnotu „%%-%%“ (irelevantní). Atribut verbtag tedy přenáší hodnoty některých gramatických kategorií od tvarů pomocného slovesa //být// ke slovesu plnovýznamovému, výjimečně i od zájmen (například tam, kde je osoba vyjádřena jen osobním zájmenem, nikoli slovesným tvarem: //já nemohl spát//). Nepřenáší však hodnoty gramatických kategorií od jiných sloves, například od sloves modálních či fázových, např. infinitiv po modálním slovese tedy bude mít pro osobu a číslo hodnotu „%%-%%“ (irelevantní).
  
-Při určování gramatických kategorií daného tvaru atribut verbtag více využívá okolního kontextu a je interpretativnější než základní 15poziční morfologický tag. Například u příčestí neobsahuje tag kategorii osoby (samo izolované příčestí osobu nevyjadřuje, typ //slyšels// je pojednán jako agregát, tedy víceslovný token), zato verbtag osobu určuje. Imperativ může mít v tagu pouze první či druhou osobu (//chraňme//, //chraň//, //chraňte//), ve verbtagu může ale v určitých kontextech nabýt i osoby třetí (//chraň Bůh//). Rozpor mezi číslem u pomocného slovesa a u příčestí v případě vykání (a pouze v ípadě vykání, ne v jiných případech) je zachycen hodnotou **v** pro gramatickou kategorii čísla ve verbtagu: například ve spojení //abyste nepřišla// bude mít příčestí //nepřišla// číslo v tagu hodnotu **S** (singulár), ve verbtagu hodnotu **v** (vykání).+Při určování gramatických kategorií daného tvaru atribut verbtag více využívá okolního kontextu a je interpretativnější než základní 15poziční morfologický tag. Například u příčestí neobsahuje tag kategorii osoby (samo izolované příčestí osobu nevyjadřuje, typ //slyšels// je pojednán jako agregát, tedy víceslovný token), zato verbtag osobu určuje. Imperativ může mít v tagu pouze první či druhou osobu (//chraňme//, //chraň//, //chraňte//), ve verbtagu může ale v určitých kontextech nabýt i osoby třetí (//chraň Bůh//). Rozpor mezi číslem u pomocného slovesa a u příčestí (týká se edevším vykání) je zachycen hodnotou **v** pro gramatickou kategorii čísla ve verbtagu: například ve spojení //abyste nepřišla// bude mít příčestí //nepřišla// číslo v tagu hodnotu **S** (singulár), ve verbtagu hodnotu **v** (vykání).
  
  
-Nyní uvedeme nejprve přehledově a poté podrobně obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami:+V této části je nejprve přehledově a poté podrobně popsán obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami:
  
  
Řádek 64: Řádek 64:
  
 Hodnotu V mají: Hodnotu V mají:
-   * tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež chápeme jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i:+   * tvary plnovýznamových sloves (včetně tvarů pasivních příčestí, jež se při značkování chápou jako tvary slovesné, nikoli adjektivní), tj. – v našem pojetí – všech sloves jiných než //být// a //bývat//, tj. i:
      * sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//.      * sloves //mít// a //dostat// charakterizovaných v mluvnicích jakožto pomocná: //Měl///V //pro strach uděláno//. //Přehled se rychle ztrácí a máme///V //zaděláno na zmatek//. //Nemáme///V //tu moc uklizeno//. //Dostala///V //přidáno a bral týdně devadesát dolarů//.
      * sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//.      * sloves modálních: //moci//, //mít//, //muset/////musit//, //smět//, //dát se//…: //Můžeš///V //se o to postarat//? //To není možné//, //nedá///V //se to udělat//.
Řádek 97: Řádek 97:
  
  
-====2. pozice – slovesný způsob====+====2. pozice – typ slovesného tvaru====
  
 možné hodnoty: **D** / **C** / **I** / **F** / **T** / **O** / %%-%% (indikativ / kondicionál / imperativ / infinitiv / přechodník / ostatní funkce trpného příčestí (doplněk nebo predikát bez spony) / irelevantní) možné hodnoty: **D** / **C** / **I** / **F** / **T** / **O** / %%-%% (indikativ / kondicionál / imperativ / infinitiv / přechodník / ostatní funkce trpného příčestí (doplněk nebo predikát bez spony) / irelevantní)
Řádek 130: Řádek 130:
  
  
-Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... chápeme jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...:+Poněvadž klauze uvozené spojkami //abych//, //abys//..., //kdybych//, //kdybys//... se chápou jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary //bych//, //bys//...:
    * //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý//    * //abych/////kdybych byl býval proklet///C //na druhou//, ale //abych/////kdybych byl býval///C //prokletý//
  
Řádek 176: Řádek 176:
  
  
-Ve verbtagu nezachycujeme reflexivní diatezi (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm nezachycujeme reflexivní pasivum, značkujeme pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční.+Ve verbtagu není zachycena reflexivní diateze (medium), tj. například ve větě: //učešu si vlasy// není u slovesného tvaru //učešu// uveden reflexivní význam (lexikálně signalizovaný reflexivem //si//). Ani v něm není zachyceno reflexivní pasivum, značkuje se pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic //se//, //si//. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (//jde se//) či význam reciproční.
  
  
Řádek 202: Řádek 202:
      * a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel//      * a u trpných příčestí ve funkci doplňku: //silně rozrušen///%%-%%, //odešel//
  
-Na 4. pozici verbtagu zachycujeme také sémanticky třetí osobu imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje.+Na 4. pozici verbtagu je vyjádřena i sémanticky třetí osoba imperativu: //chraň///3 //Bůh//; //pozdrav///3 //pánbůh//; //vem///3 //to čert//, která je morfologicky vyjádřena druhou osobou (//nedej///2, pozdrav///2//, //vem///2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje.
  
  
Řádek 290: Řádek 290:
 Hodnotu Q mají: Hodnotu Q mají:
      * aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q      * aktivní tvary minulého příčestí plnovýznamového slovesa spolutvořící předminulý čas: //pak jsem byl odešel///Q
-     * tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu jsme ji nenalezli.+     * tvary trpného příčestí plnovýznamového slovesa spolutvořící předminulý čas: //on byl býval podepsán///Q. Takováto struktura je však z hlediska úzu (reprezentovaného např. korpusem SYNv9 obsahujícího cca 5,56 mld. tokenů) ryze teoretická: v tomto korpusu nebyla nalezena.
  
 Čas se neuvádí (jeho hodnota je tedy: %%-%%): Čas se neuvádí (jeho hodnota je tedy: %%-%%):
Řádek 364: Řádek 364:
 =====Příklady značkování atributem verbtag===== =====Příklady značkování atributem verbtag=====
  
-Aby se čtenář v popisu víceslovných predikátů, který jsme právě představili, lépe orientoval, uvádíme v této části řadu ilustrativních příkladů vět z korpusů SYN2020 a SYNv9.+Aby se čtenář v právě představeném popisu víceslovných predikátů lépe orientoval, je v této části uvedena řada ilustrativních příkladů vět z korpusů SYN2020 a SYNv9.
  
  
Řádek 382: Řádek 382:
  
  
-Věta (2) neobsahuje opisné futurum, neboť ve vedlejší větě je //neříkat// infinitivní tvar ve funkci podmětu. Indikativní (**D**) tvar //bude// 3. osoby singuláru (**S**) futura (**F**) aktiva (**A**) je tedy spona (**V**, nepomocný slovesný tvar). U plnovýznamového (**V**) jednoslovného záporného infinitivního tvaru //neříkat// určujeme opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**); negace je vyjádřena v tagu (viz podrobněji v části 2.3). Tak jako ve větě (1) je všem ostatním slovním tvarům formálně přiřazen tento atribut s irelevantními hodnotami jednotlivých kategorií: //nejlepší///%%------%%, //nic///%%------%%, tečka/%%------%%.+Věta (2) neobsahuje opisné futurum, neboť ve vedlejší větě je //neříkat// infinitivní tvar ve funkci podmětu. Indikativní (**D**) tvar //bude// 3. osoby singuláru (**S**) futura (**F**) aktiva (**A**) je tedy spona (**V**, nepomocný slovesný tvar). U plnovýznamového (**V**) jednoslovného záporného infinitivního tvaru //neříkat// se určuje opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**); negace je vyjádřena v tagu (viz podrobněji v části 2.3). Tak jako ve větě (1) je všem ostatním slovním tvarům formálně přiřazen tento atribut s irelevantními hodnotami jednotlivých kategorií: //nejlepší///%%------%%, //nic///%%------%%, tečka/%%------%%.
  
  
Řádek 392: Řádek 392:
  
  
-V uvedené větě je plnovýznamový (**V**) finitní tvar //chceš// v 2. osobě singuláru (**S**) indikativu (**D**) prézentu (**P**) aktiva (**A**); u plnovýznamového jednoslovného infinitivního tvaru //dokázat// určujeme opět pouze způsob, tedy infinitiv (**F**), a aktivní diatezi (**A**).+V uvedené větě je plnovýznamový (**V**) finitní tvar //chceš// v 2. osobě singuláru (**S**) indikativu (**D**) prézentu (**P**) aktiva (**A**); u plnovýznamového jednoslovného infinitivního tvaru //dokázat// je určen opět pouze způsob, tedy infinitiv (**F**), a aktivní diateze (**A**).
  
  
Řádek 422: Řádek 422:
  
  
-Na počátku věty (6) vidíme složený slovesný tvar //přál jsem// s plnovýznamovým tvarem //přál// (verbtag: indikativ – **D**, aktivum – **A**, 1. osoba, singulár – **S**, minulý čas – **R**) a pomocným (**A**) tvarem //jsem//; dále je ve větě tvar aktivního infinitivu //představit//.+Na počátku věty (6) je složený slovesný tvar //přál jsem// s plnovýznamovým tvarem //přál// (verbtag: indikativ – **D**, aktivum – **A**, 1. osoba, singulár – **S**, minulý čas – **R**) a pomocným (**A**) tvarem //jsem//; dále je ve větě tvar aktivního infinitivu //představit//.
  
  
Řádek 432: Řádek 432:
  
  
-Ve větě (7) vyznačujeme vlastnosti pasivní konstrukce //byla nalezena// u plnovýznamového trpného příčestí //nalezena//: tj. indikativ (**D**), pasivní diateze (**P**), 3. osoba plurálu (**P**) a minulý čas (**R**); tvar //byla// je tvarem pomocného slovesa (proto **A**).+Ve větě (7) jsou vyznačeny vlastnosti pasivní konstrukce //byla nalezena// u plnovýznamového trpného příčestí //nalezena//: tj. indikativ (**D**), pasivní diateze (**P**), 3. osoba plurálu (**P**) a minulý čas (**R**); tvar //byla// je tvarem pomocného slovesa (proto **A**).
  
  
Řádek 442: Řádek 442:
  
  
-V této větě nacházíme (i) víceslovný slovesný tvar //nakopal bych//, což je aktivní (**A**) konstrukce přítomného (**P**) kondicionálu (**C**) v 1. osobě singuláru (**S**); (ii) víceslovný slovesný tvar //jsem// … //začal//, což je aktivní (**A**) konstrukce 3. osoby singuláru (**S**) indikativu (**D**) minulého času (**R**).+V této větě se nachází (i) víceslovný slovesný tvar //nakopal bych//, což je aktivní (**A**) konstrukce přítomného (**P**) kondicionálu (**C**) v 1. osobě singuláru (**S**); (ii) víceslovný slovesný tvar //jsem// … //začal//, což je aktivní (**A**) konstrukce 3. osoby singuláru (**S**) indikativu (**D**) minulého času (**R**).
  
  
Řádek 516: Řádek 516:
 (i) //bych// … //přál//, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) 1. osoby singuláru (S) (i) //bych// … //přál//, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) 1. osoby singuláru (S)
  
-(ii) //abych// … //byl býval rozhodl//, což je aktivní (A) konstrukce minulého (R) kondicionálu (C) 1. osoby singuláru (S). Tvar //abych// je značkován jako dvojice //aby// – //bych//, přičemž každá složka (tedy //aby// a //bych//) má své lemma (//aby//, resp. //být//), tag i verbtag. Verbtag tvaru složky //aby// (spojka) je irelevantní (%%------%%), tvar //bych// značkujeme jako pomocný (A%%-----%%). Pomocné (A) jsou i tvary //byl// a //býval//, takže veškeré údaje morfologicky charakterizující celý komplex //abych// … //byl býval rozhodl// jsou vyjádřeny u plnovýznamového tvaru //rozhodl//: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S). +(ii) //abych// … //byl býval rozhodl//, což je aktivní (A) konstrukce minulého (R) kondicionálu (C) 1. osoby singuláru (S). Tvar //abych// je značkován jako dvojice //aby// – //bych//, přičemž každá složka (tedy //aby// a //bych//) má své lemma (//aby//, resp. //být//), tag i verbtag. Verbtag tvaru složky //aby// (spojka) je irelevantní (%%------%%), tvar //bych// se značkuje jako pomocný (A%%-----%%). Pomocné (A) jsou i tvary //byl// a //býval//, takže veškeré údaje morfologicky charakterizující celý komplex //abych// … //byl býval rozhodl// jsou vyjádřeny u plnovýznamového tvaru //rozhodl//: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S). 
  
  
Řádek 556: Řádek 556:
  
  
-Ve větě (19) je ortografické slovo //ses//, které při značkování dělíme na dvě části: reflexivum //se// a //s// (enklitická varianta tvaru //jsi//). Každá část obdrží při značkování své lemma (//se//, resp. //být//), dále tag a verbtag (%%------%%, tj. irelevantní pro první část, tj. reflexivum //se//; A%%-----%% pro část druhou, tj. //s//); //s// je zde totiž v pomocné funkci – spolutvoří 2. osobu singuláru přítomného kondicionálu //měla by// %%-%%//s//. Tyto a další hodnoty morfologických kategorií jsou uvedeny u plnovýznamového tvaru //měla//.+Ve větě (19) se nachází ortografické slovo //ses//, které se při značkování dělí na dvě části: reflexivum //se// a //s// (enklitická varianta tvaru //jsi//). Každá část obdrží při značkování své lemma (//se//, resp. //být//), dále tag a verbtag (%%------%%, tj. irelevantní pro první část, tj. reflexivum //se//; A%%-----%% pro část druhou, tj. //s//); //s// je zde totiž v pomocné funkci – spolutvoří 2. osobu singuláru přítomného kondicionálu //měla by// %%-%%//s//. Tyto a další hodnoty morfologických kategorií jsou uvedeny u plnovýznamového tvaru //měla//.
  
  
Řádek 646: Řádek 646:
  
  
-V rezultativní konstrukci //mám vymeteno// vyjadřujeme symbolem O (= ostatní funkce trpného příčestí) hodnotu kategorie způsob (2. pozice verbtagu) u plnovýznamového tvaru //vymeteno//.+V rezultativní konstrukci //mám vymeteno// se symbolem O (= ostatní funkce trpného příčestí) vyjadřuje hodnota kategorie způsob (2. pozice verbtagu) u plnovýznamového tvaru //vymeteno//.
  
  
Řádek 672: Řádek 672:
  
  
-Ve větě (30) určuje 1. osobu příčestí //posloužila// jenom osobní zájmeno //já//, ve větě (31) osobní zájmeno pouze //my//+Ve větě (30) určuje 1. osobu příčestí //posloužila// jenom osobní zájmeno //já//, ve větě (31) pouze osobní zájmeno //my//
  
  
Řádek 680: Řádek 680:
 =====Víceslovné slovesné tvary z hlediska syntaxe a automatického značkování===== =====Víceslovné slovesné tvary z hlediska syntaxe a automatického značkování=====
  
-Značkování víceslovných slovesných tvarů umožňuje popsat stovky rozmanitých typů syntaktických struktur (typem rozumíme např. pasivní přítomný kondicionál 3. osoby plurálu), přičemž každý typ se projevuje nesčetnými slovoslednými a dalšími syntaktickými variacemi ve značkovaných větách (např. různá slova nacházející se mezi jednotlivými slovesnými tvary, která tvoří týž komplex). Mimo koordinaci slovesných tvarů (zvláště minulého a trpného příčestí a infinitivu), která představuje z hlediska spolehlivého značkování největší problém (často totiž není snadné rozpoznat předěl mezi klauzemi, existuje neshoda ve víceslovném komplexu a další komplikace, viz část 5), platí, že všechny tvary ve víceslovném slovesném komplexu se nacházejí v téže klauzi. Například při tvoření minulého času 1. a 2. osoby aktiva je jak tvar pomocného slovesa //být//, tak l%%-%%ové příčestí v téže klauzi, přičemž tato klauze může být nesouvislá, tj. může být z hlediska slovosledu přerušena jinou vnořenou klauzí či klauzemi – takové případy jsou ovšem poměrně řídké a představují pro značkování obtížný problém. V téže klauzi se jednotlivé součásti víceslovného komplexu typicky nacházejí blízko sebe (ovšem v různých slovosledných variantách), nejčastěji v těsné blízkosti, což velmi usnadňuje jejich spolehlivé automatické značkování (např. **//chtěl//**/VCA1SP **//bych//**/A%%-----%% //to udělat//; //opravdu// **//bych//**/A%%-----%% **//chtěl//**/VCA1SP //ten film vidět//). Platí, že čím jsou si jednotlivé součásti z hlediska slovosledu blíže, tím je takových struktur v korpusech více a tím je také snazší je spolehlivě značkovat. Čím dále jsou od sebe, tím strměji frekvence klesá.+Značkování víceslovných slovesných tvarů umožňuje popsat stovky rozmanitých typů syntaktických struktur (typem rozumíme např. pasivní přítomný kondicionál 3. osoby plurálu), přičemž každý typ se projevuje nesčetnými slovoslednými a dalšími syntaktickými variacemi ve značkovaných větách (např. různá slova nacházející se mezi jednotlivými slovesnými tvary, která tvoří týž komplex). Mimo koordinaci slovesných tvarů (zvláště minulého a trpného příčestí a infinitivu), jež představuje z hlediska spolehlivého značkování největší problém (často totiž není snadné rozpoznat předěl mezi klauzemi, existuje neshoda ve víceslovném komplexu a další komplikace...), platí, že všechny tvary ve víceslovném slovesném komplexu se nacházejí v téže klauzi. Například při tvoření minulého času 1. a 2. osoby aktiva je jak tvar pomocného slovesa //být//, tak l%%-%%ové příčestí v téže klauzi, přičemž tato klauze může být nesouvislá, tj. může být z hlediska slovosledu přerušena jinou vnořenou klauzí či klauzemi – takové případy jsou ovšem poměrně řídké a představují pro značkování obtížný problém. V téže klauzi se jednotlivé součásti víceslovného komplexu typicky nacházejí blízko sebe (ovšem v různých slovosledných variantách), nejčastěji v těsné blízkosti, což velmi usnadňuje jejich spolehlivé automatické značkování (např. **//chtěl//**/VCA1SP **//bych//**/A%%-----%% //to udělat//; //opravdu// **//bych//**/A%%-----%% **//chtěl//**/VCA1SP //ten film vidět//). Platí, že čím jsou si jednotlivé součásti z hlediska slovosledu blíže, tím je takových struktur v korpusech více a tím je také snazší je spolehlivě značkovat. Čím dále jsou od sebe, tím strměji frekvence klesá.
  
-Značkování tak může např. napomoci identifikaci slov (nejen tvarů tvořících víceslovný (složený) slovesný komplex) nacházejících se v téže klauzi. Obecně lze říci, že uživatel má v atributu verbtag vhodný nástroj ke zkoumání slovosledu v klauzi, může snáze než dosud zjišťovat, které slovní tvary se nacházejí mezi jednotlivými částmi slovesného komplexu toho či onoho morfosyntaktického typu v klauzi nebo snáze zjišťovat, do jaké klauze patří trpné příčestí a s jakými pomocnými tvary tvoří slovesný význam (představené morfosyntaktické značkování však neidentifikuje například nějakou společnou značkou, že ta či ona skupina slovesných tvarů vytváří víceslovný slovesný tvar!). Uživatel může dále poměrně snadno zjišťovat frekvenci těch či oněch typů víceslovných slovesných tvarů nebo významů např. morfosyntakticky homonymních příčestí (příčestí jako součást kondicionálových,i indikativních či dalších struktur), frekvenci struktur opisného pasiva v kombinaci s číslem, osobou a jmenným rodem apod.+Značkování tak může např. napomoci identifikaci slov (nejen tvarů tvořících víceslovný (složený) slovesný komplex) nacházejících se v téže klauzi. Obecně lze říci, že uživatel má v atributu verbtag vhodný nástroj ke zkoumání slovosledu v klauzi, může snáze než dosud zjišťovat, které slovní tvary se nacházejí mezi jednotlivými částmi slovesného komplexu toho či onoho morfosyntaktického typu v klauzinebo snáze zjišťovat, do jaké klauze patří trpné příčestí a s jakými pomocnými tvary tvoří slovesný význam (představené morfosyntaktické značkování však neidentifikuje například nějakou společnou značkou, že ta či ona skupina slovesných tvarů vytváří víceslovný slovesný tvar!). Uživatel může dále poměrně snadno zjišťovat frekvenci těch či oněch typů víceslovných slovesných tvarů nebo významů např. morfosyntakticky homonymních příčestí (příčestí jako součást kondicionálových,i indikativních či dalších struktur), frekvenci struktur opisného pasiva v kombinaci s číslem, osobou a jmenným rodem apod.
  
-Je jasné, že automatické značkování (podrobněji v části 5) zdaleka není bezchybné a uživatel musí k výsledkům značkování přistupovat kriticky. Problémy způsobují nejen poměrně snadno odstranitelné chyby, jichž se systém značkování v současné verzi dopouští, a které by se tedy neměly objevit v dalších verzích značkovaných korpusů, ale i to, že úkol značkovat víceslovné slovesné komplexy je složitý z povahy věci (volný slovosled, elipsy, vnořené klauze, morfologická homonymie jednotlivých slovesných tvarů…), a někdy není ani teoreticky jasné, jak by se ten či onen jev měl značkovat. Příklady složitějších jevů lze nalézt v části 4.+Je jasné, že automatické značkování zdaleka není bezchybné a uživatel musí k výsledkům značkování přistupovat kriticky. Problémy způsobují nejen poměrně snadno odstranitelné chyby, jichž se systém značkování v současné verzi dopouští, a které by se tedy neměly objevit v dalších verzích značkovaných korpusů, ale i to, že úkol značkovat víceslovné slovesné komplexy je složitý z povahy věci (volný slovosled, elipsy, vnořené klauze, morfologická homonymie jednotlivých slovesných tvarů…), a někdy není ani teoreticky jasné, jak by se ten či onen jev měl značkovat.
  
 Některé jevy spjaté s morfosyntaktickým značkováním sloves tedy předvedená koncepce značkování (zatím) vzhledem ke složitosti syntaktických a dalších jevů nezachycuje. Je to například afirmace/negace víceslovného komplexu jako celku (afirmace/negace jednotlivých tvarů se určuje na 11. pozici v tagu). Patrně by automaticky bylo možné zachytit negaci v těchto větách: Některé jevy spjaté s morfosyntaktickým značkováním sloves tedy předvedená koncepce značkování (zatím) vzhledem ke složitosti syntaktických a dalších jevů nezachycuje. Je to například afirmace/negace víceslovného komplexu jako celku (afirmace/negace jednotlivých tvarů se určuje na 11. pozici v tagu). Patrně by automaticky bylo možné zachytit negaci v těchto větách:
Řádek 706: Řádek 706:
  
  
-který vyjadřuje oslabenou afirmaci (litotes) a je otázka, zda tuto vlastnost komplexu připsat, a pokud ano, jak by to bylo spolehlivé. Uživatel je tedy při svých rešerších odkázán na kombinaci vlastností obsažených v tagu (kde je kromě negace i vid a další morfologické vlastnosti izolovaného slovesného tvaru, viz konec části 2.1) a v morfosyntaktickém verbtagu. Další problém nastává u konstrukcí, ve kterých můžeme negaci použít na různých místech, přičemž se význam mírně změní, jako v příkladech (35) a (36):+který vyjadřuje oslabenou afirmaci (litotes) a je otázka, zda tuto vlastnost komplexu připsat, a pokud ano, jak by to bylo spolehlivé. Uživatel je tedy při svých rešerších odkázán na kombinaci vlastností obsažených v tagu (kde je kromě negace i vid a další morfologické vlastnosti izolovaného slovesného tvaru) a v morfosyntaktickém verbtagu. Další problém nastává u konstrukcí, ve kterých můžeme negaci použít na různých místech, přičemž se význam mírně změní, jako v příkladech (35) a (36):
  
  
Řádek 716: Řádek 716:
  
  
-Rovněž tak jsme rezignovali na značkování struktur s modálními a fázovými slovesy a struktur rezultativních, jelikož značkování by nemuselo být přijatelně spolehlivé. Například výskyty polyfunkčního slovesa //mít// a //dát// (//se//) (obě slovesa jsou modální i plnovýznamová) v modálním/nemodálním užití a jako součást víceslovného komplexu by byly pravděpodobně značkovány poměrně nespolehlivě.+Rovněž se neznačkují struktury s modálními a fázovými slovesy a struktur rezultativních, jelikož značkování by nemuselo být přijatelně spolehlivé. Například výskyty polyfunkčního slovesa //mít// a //dát// (//se//) (obě slovesa jsou modální i plnovýznamová) v modálním/nemodálním užití a jako součást víceslovného komplexu by byly pravděpodobně značkovány poměrně nespolehlivě.