V tomto detailním přehledu je nejprve uvedeno, které morfologické kategorie a jejich hodnoty v atributu verbtag se při značkování zachycují a kterým slovním tvarům jsou tyto údaje připisovány. Poté se na příkladech předvádí, jak se struktury se složenými slovesnými tvary značkují v korpusech SYN2020, SYNv9 a SYNv10, a nakonec jsou stručně popsány některé aspekty složených slovesných tvarů z hlediska syntaxe (jednoduché a složitější případy) a jejich automatického značkování.
Slovní tvary jsou v korpusech SYN2020, SYNv9 a SYNv10 morfologicky značkovány dvěma atributy: základním 15pozičním tagem a 6pozičním atributem verbtag. Atribut verbtag obsahuje informace o hodnotách gramatických kategorií slovesa, a to jak u tvarů jednoduchých (napíšu, slyšet, jsem, hovořil), tak u tvarů složených (budu psát, slyšeli jste, byli bychom připravili, být spasen). Odlišuje také pomocné tvary slovesa být/býti a bývat/bývati od tvarů plnovýznamových a od spony u verbonominálního predikátu, která se rovněž chápe jako plnovýznamová. Atribut verbtag tvoří šest pozic, přičemž jen u sloves a u deverbativních adjektiv zakončených na -ný, -tý (viz popis 3. pozice níže) nabývá jiných hodnot než hodnoty „------“ (irelevantní).
Atribut verbtag tedy přenáší hodnoty některých gramatických kategorií od tvarů pomocného slovesa být ke slovesu plnovýznamovému, výjimečně i od zájmen (například tam, kde je osoba vyjádřena jen osobním zájmenem, nikoli slovesným tvarem: já nemohl spát). Nepřenáší však hodnoty gramatických kategorií od jiných sloves, například od sloves modálních či fázových, např. infinitiv po modálním slovese tedy bude mít pro osobu a číslo hodnotu „-“ (irelevantní).
Při určování gramatických kategorií daného tvaru atribut verbtag více využívá okolního kontextu a je interpretativnější než základní 15poziční morfologický tag. Například u příčestí neobsahuje tag kategorii osoby (samo izolované příčestí osobu nevyjadřuje, typ slyšels je pojednán jako agregát, tedy víceslovný token), zato verbtag osobu určuje. Imperativ může mít v tagu pouze první či druhou osobu (chraňme, chraň, chraňte), ve verbtagu může ale v určitých kontextech nabýt i osoby třetí (chraň Bůh). Rozpor mezi číslem u pomocného slovesa a u příčestí (týká se především vykání) je zachycen hodnotou v pro gramatickou kategorii čísla ve verbtagu: například ve spojení abyste nepřišla bude mít příčestí nepřišla číslo v tagu hodnotu S (singulár), ve verbtagu hodnotu v (vykání).
V této části je nejprve přehledově a poté podrobně popsán obsah atributu verbtag. Tvoří jej šest pozic s těmito hodnotami:
1. pozice – druh slovesa: pomocné sloveso / plnovýznamové sloveso
2. pozice – slovesný způsob: indikativ / kondicionál / infinitiv / imperativ / přechodník; a navíc samostatně stojící trpné příčestí
3. pozice – diateze: aktivní / pasivní
4. pozice – osoba: první / druhá / třetí
5. pozice – číslo: singulár / plurál / vykání
6. pozice – čas: předminulý čas / minulý čas / prézens / futurum
možné hodnoty: A / V / - (pomocné / plnovýznamové / irelevantní)
Na této pozici se odlišují tvary slovesa být, bývat jakožto pomocného slovesa od tvarů plnovýznamových sloves.
Značka | Význam | Příklady |
V | sloveso plnovýznamové a sponové být a bývat | dělám; zaslechl jsem; budu pracovat; jsem poslanec; celkem vzato |
A | slovesa být a bývat, fungují-li jako pomocná (včetně kondicionálových tvarů slovesa být a částí agregátů (víceslovných tokenů) | zaslechl jsem; budu pracovat; byl bych býval odešel; viděl ses; je chválen |
- | hodnota nevyplněna (irelevantní); tvar jiného slovního druhu než slovesa |
Hodnotu A mají tvary pomocného slovesa být a bývat, a to včetně
Tvary pomocného slovesa být a bývat se používají při:
Verbtag pomocného slovesa má podobu A - - - - -; mimo pomocnost se tedy u pomocného slovesa žádné další kategorie neurčují.
Hodnotu V mají:
Obecně platí, že jednoduchý plnovýznamový slovesný tvar nebo složený slovesný tvar obsahuje právě jeden jednoduchý slovesný tvar s hodnotou V na první pozici verbtagu.
Slovesný tvar mající hodnotu V na první pozici verbtagu může mít v závislosti na svém typu vyplněny všechny hodnoty na 2. až 6. pozici (viz níže).
Z uvedeného popisu tedy mj. vyplývá, že interpretace dvou podobných struktur (dlouhý tvar deverbativního adjektiva typu -ný/tý a trpné příčestí) se z hlediska verbtagu liší:
možné hodnoty: D / C / I / F / T / O / - (indikativ / kondicionál / imperativ / infinitiv / přechodník / ostatní funkce trpného příčestí (doplněk nebo predikát bez spony) / irelevantní)
Písmeny označené hodnoty může mít jen slovesný tvar, který má na první pozici V.
Značka | Význam | Příklady |
D | indikativ | odešla, odcházím, odejdu; byl doma; byl jsem přirovnáván; byl/býval jsem přirovnávaný; posadím, budou sedět |
C | kondicionál | odešel bych; byl bych (býval) odešel, byla bys (bývala) chycena; abych/kdybych byla bývala potrestána |
I | imperativ | odejdi; buďte chváleny |
F | infinitiv | sedět na zahradě se mu líbilo; chci tady sedět; možnost odejít do zahraničí; být úspěšný, být v lese; být přirovnáván; viděl ho přicházet |
T | přechodník (transgresiv) | chutně vaříce; jsouc vystavena velké zátěži |
O | ostatní funkce trpného příčestí (doplněk nebo predikát bez spony nebo součást rezultativní konstrukce) | poslouchal mne znuděn; mám jídlo uvařeno; Craig se bezmocně motal ve vlnách, nadnášen záchrannou vestou; bankovní loupež zmařena |
- | hodnota nevyplněna (irelevantní); jiný slovní tvar než plnovýznamové sloveso | tvary pomocných sloves |
Hodnotu D (indikativ) na 2. pozici tedy mají:
Hodnotu C (kondicionál) na 2. pozici mají:
Poněvadž klauze uvozené spojkami abych, abys…, kdybych, kdybys… se chápou jako kondicionálové, značkování sloves v nich bude stejné, jako kdyby v nich byly přítomny kondicionálové tvary bych, bys…:
Hodnotu I (imperativ) na 2. pozici mají:
Hodnotu F (infinitiv) na 2. pozici mají:
Hodnotu T (přechodník/transgresiv) na 2. pozici mají:
Hodnotu O (ostatní funkce trpného příčestí) na 2. pozici mají trpná příčestí ve funkci doplňku, nikoli jmenného přísudku, a v rezultativních konstrukcích: poslouchal mne, znuděn/O; mám jídlo uvařeno/O; na výsost znechucen/O špatným dojmem, který Clevinger vyvolával; koncert zrušen/O bez náhrady
Oproti tomu ve strukturách se sponou se trpná příčestí značkují podle způsobu, jaký pasivní konstrukce vyjadřuje, např. indikativ v klauzi: byl jsem zahrnován/D holdy jako milionář.
možné hodnoty: A / P / p / - (aktivum / pasivum / složené deverbativní adjektivum zakončené na -ný nebo -tý / irelevantní)
Značka | Význam | Příklady |
A | aktivum | odešla, odcházím, odejdu; odešel bych; byl bych (býval) odešel; byl doma; popojdu, budou sedět |
P | pasivum | byla bys (bývala) chycena; abych/kdybych byla bývala informována; být zastrašen; jsem přirovnáván; buďte pochváleny |
p | složená (dlouhá) deverbativní adjektiva zakončená na -ný/-tý a odvozená od trpného příčestí | dílo bylo vyvážené; ležel zabitý na trávníku; jsem nadmíru spokojený; byl/býval přirovnávaný k Mozartovi; zabitá neděle |
- | hodnota nevyplněna (irelevantní); jiný slovní tvar než plnovýznamové sloveso nebo deverbativní adjektivum zakončené na -ný/-tý |
Na 3. pozici mají hodnotu A (aktivum) aktivní slovesné tvary, hodnotu P (pasivum) pasivní slovesné tvary. Tyto hodnoty jsou ve verbtagu totožné s příslušnými hodnotami v tagu (12. pozice). Hodnotu A nebo P může mít jen slovesný tvar, který má na první pozici V. Hodnotu p má pouze deverbativní adjektivum zakončené na -ný nebo -tý a toto adjektivum nemá žádné další hodnoty, jeho verbtag je tudíž vždy roven - - p - - - .
Ve verbtagu není zachycena reflexivní diateze (medium), tj. například ve větě: učešu si vlasy není u slovesného tvaru učešu uveden reflexivní význam (lexikálně signalizovaný reflexivem si). Ani v něm není zachyceno reflexivní pasivum, značkuje se pouze pasivum opisné. Reflexivní pasivum totiž není snadné spolehlivě značkovat vzhledem k velmi obtížně disambiguovatelné homonymii reflexivních částic se, si. Navíc ani teoreticky nepanuje mezi odborníky shoda v tom, zda konstrukce s reflexivními částicemi spoluvytvářejí reflexivní pasivum nebo třeba neosobní konstrukce (jde se) či význam reciproční.
možné hodnoty: 1 / 2 / 3 / - (první / druhá / třetí / irelevantní)
Hodnoty označené čísly může mít jen slovesný tvar, který má na první pozici V.
Značka | Význam | Příklady |
1 | první osoba | přišel jsem; vylézáme; neodejdu; nepopojdeme; budu sedět; připravili bychom to; budeme zainteresováni; připravme to; buďme odhodláni |
2 | druhá osoba | odejdete; odejděte; byla bys (bývala) chycena; jste infikováni; budete zastrašeni; buďte připraveny; jsouce chváleni; hodně ses snažila |
3 | třetí osoba | Pavel přišel včas; byl ztracen; bude připravovat; je odhodlán; chraň Bůh |
- | hodnota nevyplněna (irelevantní); tvar, který tvoří infinitiv, přechodník, doplněk nebo predikát bez spony, a dále jakýkoli slovní tvar jiný než plnovýznamové sloveso | musím jít; být přinesen;vycházejíc; jsa přinesen |
Při značkování osoby platí tyto zásady:
1. osoba 1/2/3 se uvádí u všech nepomocných tvarů morfologického prézentu (přinášíme, přinesou), futura (bude, půjdu), tvaru imperativního (vyskoč!) a u minulého (l-ového) příčestí, pasivního příčestí a infinitivu ve finitní konstrukci: byli bychom připravili/1; byl byste zatčen/2; nebudeme to odkládat/1
2. osoba 1/2/3 se neuvádí u těchto nefinitních konstrukcí:
Na 4. pozici verbtagu je vyjádřena i sémanticky třetí osoba imperativu: chraň/3 Bůh; pozdrav/3 pánbůh; vem/3 to čert, která je morfologicky vyjádřena druhou osobou (nedej/2, pozdrav/2, vem/2) na 8. pozici tagu, neboť čeština morfologicky třetí osobu imperativu nevyjadřuje.
možné hodnoty: S / P / v / - (singulár / plurál / vykání / irelevantní)
Hodnoty označené písmeny může mít jen slovesný tvar, který má na první pozici V.
Značka | Význam | Příklady |
S | singulár | přišel jsem; bude je škádlit; neodejdu; budeš sedět; připravil bych to; bude zainteresován; připrav to; buď odhodlána; být uveden |
P | plurál | odejdete; vylézáme; nepopojdeme; nebyly by zainteresovány; čtěme; nebuďte překvapeni; nebuďte překvapení; budou číst |
v | vykání jednotlivci | nedostavil jste se; měla byste, paní účetní, vědět |
- | hodnota nevyplněna (irelevantní); tvar, který tvoří infinitiv a jakýkoliv slovní tvar jiný než plnovýznamové sloveso | odpočívat je příjemné; musím jít; měl byste vědět; být uveden (singulár příčestí je uveden jen v tagu – viz níže) |
Při značkování čísla platí tyto zásady:
1. Hodnotu v (vykání jednotlivci) má pouze minulé příčestí a trpné příčestí plnovýznamového slovesa v singuláru (v přechodníkových konstrukcích se v dnešní češtině nevyskytuje) v konstrukci s vykáním jednotlivci, kde je rozpor v čísle: mezi plurálem pomocných sloves a singulárem plnovýznamového slovesa: vy byste to zařídil/v oproti vy byste to zařídili/P. Neznačkuje se vykání v plurálu (tedy vykání skupině osob) vzhledem k tomu, že homonymii mezi vykáním a nevykáním v plurálu nelze patrně nikdy pouze na základě textu disambiguovat.
2. U plnovýznamových sloves je hodnota S (singulár) nebo P (plurál) na 5. pozici verbtagu totožná s hodnotou čísla (S nebo P) na 4. pozici tagu až na:
3. Číslo S/P se uvádí u všech tvarů plnovýznamových sloves až na
možné hodnoty: P / F / B / R / Q /- (prézens / futurum / prézens/futurum obouvidých sloves / minulý čas / předminulý čas / irelevantní)
Hodnoty označené písmeny může mít jen slovesný tvar, který má na první pozici V.
Značka | Význam | Příklady |
P | prézens | sedím; jsem doma; jsem přesvědčen; jsouc vychována jen italsky; udělal bych; byla bych potěšena (kondicionál přítomný) předběžnou úmluvou |
F | futurum | budu pracovat; budu chtít spát; poběží, půjdu, pojedeme; pochválí; odešle; zítra budu v práci; dopustí se provinění a bude potrestán |
B | prézens/futurum obouvidých sloves | rezignuji; věnuje |
R | minulý čas | přišel; byl chycen; byl bych (býval) seděl, býval bych seděl (kondicionál minulý); kdo by byl býval zarmoucen (kondicionál minulý) smrtí; byvši vyzvána k odstranění jámy |
Q | předminulý čas | pak jsem byl odešel; byl býval chytán |
- | hodnota nevyplněna (irelevantní); tvar, který tvoří infinitiv, přechodník, imperativ, doplněk nebo predikát bez spony a jakýkoli jiný slovní tvar než plnovýznamové sloveso | to musí být blbé, být zraněn; buď připraven; znechucen odešel |
Při značkování času platí tyto zásady:
1. Hodnotu P mají:
2. Hodnotu F mají:
Verbtag tedy umožňuje nalézt synonymní vyjádření futura jediným dotazem: například víceméně synonymní futurální slovesné tvary/konstrukce se dají v dotazovacím jazyce CQL (corpus query language) nalézt dotazem: [verbtag=„…..F“]
Hodnotu B mají tvary obouvidých sloves (viz i pozn. 9), u nichž není jasné, zda čas je prézens, nebo futurum: abdikuji/B; rezignuju/B; věnuji/B
Hodnotu R mají:
Hodnotu Q mají:
Čas se neuvádí (jeho hodnota je tedy: -):
Stručně ještě připomeňme, které údaje o slovesu se nacházejí v 15pozičním tagu, jímž se značkují jednoslovné slovesné tvary.
Na 2. pozici (bližší určení slovního druhu vyjádřeného na 1. pozici):
B – indikativ prézentu / syntetického futura aktiva
p – minulé (l-ové) příčestí
s – trpné příčestí
f – infinitiv
i – imperativ
c – tvar kondicionálu
e - přechodník přítomný
m – přechodník minulý
Na 3. pozici (jmenný rod):
M – životné maskulinum
I – neživotné maskulinum
F – femininum
N – neutrum
- – irelevantní
Na 4. pozici (číslo):
S – singulár
P – plurál
- – irelevantní
Na 8. pozici (osoba):
1 – první osoba
2 – druhá osoba
3 – třetí osoba
- – irelevantní
Na 9. pozici (čas):
P – prézens
F – futurum
R – minulé příčestí
- – irelevantní
Na 11. pozici (negace):
A – afirmativní
N – negativní tvar
Na 12. pozici (slovesný rod):
A – aktivní tvar
P – pasivní tvar
Na 13. pozici (vid):
I – nedokonavý
P – dokonavý
B – sloveso obouvidé
Aby se čtenář v právě představeném popisu víceslovných predikátů lépe orientoval, je v této části uvedena řada ilustrativních příkladů vět z korpusů SYN2020 a SYNv9.
(1) Zřejmě se z toho budu/A----- muset/VDA1SF dostat/VFA--- sám.
Ve větě (1) je opisné futurum nedokonavého (v našem smyslu) plnovýznamového (V) slovesa muset, které je v indikativu (D) aktiva (A) 1. osoby singuláru (S) futura (F), přičemž slovesný tvar budu je pomocný (A-----). Dále se v ní nachází infinitivní (F) tvar jednoslovného plnovýznamového slovesa dostat – tvar je pochopitelně aktivní A, neboť čeština nemá syntetický pasivní infinitiv. Příklad tak ukazuje, že atribut verbtag se nevyjadřuje pouze u analytických slovesných tvarů. Atribut verbtag dostávají i neslovesné tvary ve větě, mají ovšem irelevantní hodnoty všech kategorií: zřejmě/------, se/------, z/------, toho/------, sám/------.
(2) Nejlepší bude/VDA3SF nic neříkat/VFA--- .
Věta (2) neobsahuje opisné futurum, neboť ve vedlejší větě je neříkat infinitivní tvar ve funkci podmětu. Indikativní (D) tvar bude 3. osoby singuláru (S) futura (F) aktiva (A) je tedy spona (V, nepomocný slovesný tvar). U plnovýznamového (V) jednoslovného záporného infinitivního tvaru neříkat se určuje opět pouze způsob, tedy infinitiv (F), a aktivní diatezi (A); negace je vyjádřena v tagu (viz podrobněji v části 2.3). Tak jako ve větě (1) je všem ostatním slovním tvarům formálně přiřazen tento atribut s irelevantními hodnotami jednotlivých kategorií: nejlepší/------, nic/------, tečka/------.
(3) Jak to chceš/VDA2SP dokázat/VFA---?
V uvedené větě je plnovýznamový (V) finitní tvar chceš v 2. osobě singuláru (S) indikativu (D) prézentu (P) aktiva (A); u plnovýznamového jednoslovného infinitivního tvaru dokázat je určen opět pouze způsob, tedy infinitiv (F), a aktivní diateze (A).
(4) Kde jsi/A----- byl/VDA2SR celou noc?
Tvar pomocného (A) slovesa jsi se v této větě spojuje s plnovýznamovým (V) tvarem byl, jemuž jsou přiřazeny vlastnosti celého minulého času, tj. indikativ (D), aktivní diateze (A), 2. osoba singuláru (S) a minulý čas (R).
(5) Jsem/VDA1SP mravný, tolerantní, nezvykle spokojený/–p--- se životem, hledím/VDA1SP s optimismem do budoucna.
Ve větě (5) je tvar jsem plnovýznamový (V), neboť je to spona, jež se spojuje se jmenným přísudkem spokojený. Tento tvar je deverbativní adjektivum zakončené v základním tvaru Nsg na -ný, a dostává tedy verbtag rovný --p---.
(6) Přál/VDA1SR jsem/A----- si představit/VFA--- svým čtenářům jeden z charakterových typů naší nedávné minulosti.
Na počátku věty (6) je složený slovesný tvar přál jsem s plnovýznamovým tvarem přál (verbtag: indikativ – D, aktivum – A, 1. osoba, singulár – S, minulý čas – R) a pomocným (A) tvarem jsem; dále je ve větě tvar aktivního infinitivu představit.
(7) Těla dosud nebyla/A----- nalezena/VDP3PR.
Ve větě (7) jsou vyznačeny vlastnosti pasivní konstrukce byla nalezena u plnovýznamového trpného příčestí nalezena: tj. indikativ (D), pasivní diateze (P), 3. osoba plurálu (P) a minulý čas (R); tvar byla je tvarem pomocného slovesa (proto A).
(8) Nakopal/VCA1SP bych/A----- si, že jsem/A----- s tím vším začal/VDA1SR.
V této větě se nachází (i) víceslovný slovesný tvar nakopal bych, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) v 1. osobě singuláru (S); (ii) víceslovný slovesný tvar jsem … začal, což je aktivní (A) konstrukce 3. osoby singuláru (S) indikativu (D) minulého času (R).
(9) Byly/A----- by/A----- uloženy/VDP3PP do mobilní aplikace.
Ve větě (9) je přítomen složený slovesný tvar byly by uloženy vyjadřující pasivní (P na 3. pozici) přítomný (P na 6. pozici) kondicionál (C) 3. osoby plurálu (P na 5. pozici) – tyto údaje jsou uvedeny u plnovýznamového tvaru uloženy; tvary byly a by jsou pomocné.
(10) Byli/A----- by/A-----asi velmi překvapeni/VCP3PP, že je tehdy natočil/VDA3SR návštěvník z Barcelony.
V této větě je hodnotou atributu verbtag značkována pasivní (P na 3. pozici) kondicionálová (C) konstrukce byli by … překvapeni ve 3. osobě plurálu (P na 5. pozici). Čas je prézens (P na 6. pozici), neboť kondicionál je přítomný.
(11) Měl/VCA3SP by/A----- být/A----- vyvážen/VFP--- menším kravatovým uzlem.
Věta (11) obsahuje slovesnou konstrukci měl by být vyvážen, ale její části měl by a být vyvážen jsou značkovány odděleně: měl by je konstrukce s aktivním přítomným kondicionálem (diateze je aktivní: A, čas je prézens: P), být vyvážen je konstrukce s pasivním infinitivem, kde být je pomocné (A) a vyvážen je trpné (P) příčestí (F značí infinitiv).
(12) Půjdu/VDA1SF, až se mi bude/A----- chtít/VDA3SF a až budu/A----- připraven/VDP1SF.
Ve větě (12) je půjdu tvarem syntetického futura (F) indikativu (D) aktiva (A) slovesa jít v 1. osobě singuláru (S). Dále tu jsou dvě konstrukce s indikativem (D) budoucího (F) času: aktivní (A) opisné futurum bude chtít s pomocným slovesným tvarem bude (A) a plnovýznamovým infinitivním tvarem chtít, jemuž jsou přiřazeny všechny relevantní hodnoty atributu verbtag; indikativní (D) pasivní (P) konstrukce budu připraven opisného futura (F) 1. osoby singuláru (S) budu připraven, kde tvar budu je pomocný a připraven plnovýznamový.
(13) Kašli/VIA2S- na to, zařídím/VDA1SF to sama.
Věta (13) obsahuje dvě nesouvisející slovesné konstrukce tvořené vždy jedním slovesným tvarem: kašli je tvar aktivního (A) imperativu (I) 2. osoby singuláru (S), který jakožto tvar imperativní pochopitelně nevyjadřuje čas; zařídím je tvar indikativu (D) aktiva (A) neopisného futura (F) dokonavého slovesa zařídit (vid se značkuje na 13. pozici tagu, nikoli verbtagu, viz výše) v 1. osobě singuláru (S).
(14) Buď/A----- ujištěna/VIP2S-, že s ním žádné problémy mít/VDA1PF nebudeme/A-----.
Na rozdíl od věty (13) je v větě (14) dvouslovná konstrukce s pasivním imperativem buď ujištěna, kde buď je tvar pomocného slovesa být a u trpného příčestí ujištěna je ve verbtagu vyznačen způsob (imperativ – I), pasivní diateze (P), 2. osoby singuláru (S). Na konci věty je plurálová (P) aktivní (A) konstrukce s opisným futurem (F) mít nebudeme v 1. osobě.
(15) Jak bych/A----- si přál/VCA1SP, abych/------|A----- se byl/A----- býval/A----- rozhodl/VCA1SR jinak.
V této větě se vyskytují dvě kondicionálové konstrukce:
(i) bych … přál, což je aktivní (A) konstrukce přítomného (P) kondicionálu (C) 1. osoby singuláru (S)
(ii) abych … byl býval rozhodl, což je aktivní (A) konstrukce minulého (R) kondicionálu (C) 1. osoby singuláru (S). Tvar abych je značkován jako dvojice aby – bych, přičemž každá složka (tedy aby a bych) má své lemma (aby, resp. být), tag i verbtag. Verbtag tvaru složky aby (spojka) je irelevantní (------), tvar bych se značkuje jako pomocný (A-----). Pomocné (A) jsou i tvary byl a býval, takže veškeré údaje morfologicky charakterizující celý komplex abych … byl býval rozhodl jsou vyjádřeny u plnovýznamového tvaru rozhodl: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S).
(16) Kdybych/------|A----- byl/A----- býval/A----- získal/VCA1SR lepší vzdělání, možná bych/A----- uměl/VCA1SP napsat/VFA--- program bez chyby.
Věta (16) obsahuje konstrukci kdybych byl býval získal s aktivním (A) minulým (R) kondicionálem (C) a konstrukci s aktivním (A) přítomným (P) kondicionálem (C) bych uměl. Tvar kdybych je – analogicky jako tvar abych ve větě (15) – značkován jako dvojice kdyby – bych, přičemž každá složka (tedy kdyby a bych) má své lemma (kdyby, resp. být), tag i verbtag. Verbtag tvaru složky kdyby (spojka) je irelevantní (------), tvar bych je pomocný (A-----). Pomocné jsou i tvary byl a býval, a tak všechny morfologické informace o komplexu kdybych … byl býval získal jsou vyjádřeny u plnovýznamového tvaru získal: minulý (R) kondicionál (C) aktiva (A) 1. osoby singuláru (S).
(17) I byl/A----- měl/VDA3SQ zato, že by/A----- ho neměli/VCA3SP zatěžovat smutkem kvůli někomu o tři generace staršímu, koho skoro neznal/VDA3SR.
Věta (17) obsahuje jev, který je v současné češtině velmi vzácný: konstrukci indikativu předminulého času byl měl: tvar byl je pomocný, konstrukce 3. osoby singuláru (S) je indikativní (D), aktivní (A), čas předminulý (Q). Mimoto se ve větě nachází konstrukce s přítomným kondicionálem by … neměli a jednoslovný slovesný indikativní tvar neznal.
(18) Změnila/VDA3SR směr, doufajíc/VTA-SP, že si jí nikdo nevšiml/VDA3SR.
Ve větě (18) se mimo jednoslovné predikáty změnila a nevšiml indikativu (D) minulého času (R) nachází aktivní tvar (A) přítomného (P) přechodníku (T) doufajíc ve femininu singuláru (S), u něhož pochopitelně není vyjádřena osoba.
(19) Víš, Courtney, měla/VCA2SP by ses/------|A---- trochu vzchopit/VFA--- a nechat/VFA--- si vanu obložit/VFA--- mramorem.
Ve větě (19) se nachází ortografické slovo ses, které se při značkování dělí na dvě části: reflexivum se a s (enklitická varianta tvaru jsi). Každá část obdrží při značkování své lemma (se, resp. být), dále tag a verbtag (------, tj. irelevantní pro první část, tj. reflexivum se; A----- pro část druhou, tj. s); s je zde totiž v pomocné funkci – spolutvoří 2. osobu singuláru přítomného kondicionálu měla by -s. Tyto a další hodnoty morfologických kategorií jsou uvedeny u plnovýznamového tvaru měla.
(20) Podívej/VIA2S-, seš/VDA2SP přesně tam, kdes/------|A----- začal/VDA2SR, popletenej/–p--- a zblblej.
I v této větě se vyskytuje tvar enklitického -s, které je připojeno k adverbiu kde (kdes) a spolu s minulým příčestím začal tvoří 2. osobu singuláru (S) složeného minulého (R) času -s začal; morfologické hodnoty popisující tento složený minulý čas se uvádějí u jeho plnovýznamové složky začal. Ve větě je mimoto imperativní tvar (I) 2. osoby singuláru (S) Podívej, dále seš, tj. indikativ prézentu 2. osoby singuláru, a popletenej, což je adjektivum zakončené v základním tvaru na -ný: u těchto tvarů jsou uvedeny hodnoty příslušného atributu verbtag.
(21) Bůh mě chraň/VIA3S- před touhle ženskou, pomyslel/VDA3SR si…
Věta (21) je příkladem 3. osoby imperativu morfologicky vyjádřené 2. osobou: aktivní (A) imperativní (I) tvar chraň má v tagu uvedenu morfologickou 2. osobu singuláru (S), ve verbtagu pak její sémantickou interpretaci: 3. osobu singuláru (S).
(22) Budiž/A----- to řečeno/VIP3S- k jejich hanbě.
Věta (22) obsahuje pasivní imperativ s významem 3. osoby – tato osoba je uvedena ve verbtagu plnovýznamového tvaru řečeno; v tagu tvaru budiž je uvedena morfologická 2. osoba.
(23) Budiž/A---- pochválena/VIP2S-, matko země!
Konstrukce budiž pochválena ve větě (23) je na rozdíl od věty (21) a (22) sémanticky ve 2. osobě, neboť mluvčí se obrací k entitě vyjádřené vokativem (matko!).
(24) Zklamal/VDA2vR jste/A----- naši důvěru a ponížil/VDA2vR mě před elitou.
Ve větě (24) předvádíme, jak se ve verbtagu značkuje vykání jednotlivci v indikativu (D) aktiva (A) minulého času (R). Ve složeném minulém čase zklamal jste je neshoda v čísle mezi tvarem minulého příčestí zklamal (singulár) a tvarem jste (údaj o jeho plurálu je uveden v tagu) jakožto tvarem pomocného být. Tato neshoda se vyjádří hodnotou v na pozici čísla ve verbtagu (tedy nikoli S ani P). Stejně jako zklamal je značkován i tvar ponížil, neboť má tytéž vlastnosti jako první konjunkt zklamal, jen u něho chybí pomocné jste.
(25) Vaše reference jsou/VDA3PP vynikající a byl/A---- jste/A---- mi doporučen/VDP2vR.
Ve větě (25) vyjadřuje indikativní pasivní konstrukce byl jste … doporučen vykání jednotlivci a tento údaj je spolu s dalšími (indikativ pasiva 2. osoby singuláru) uveden u plnovýznamového tvaru doporučen, tvary jste a byl jsou pomocné, jejich číslo (plurál, resp. singulár) je uvedeno v jejich tagu.
(26) Měla/VCA2vP byste/A----- zavolat/VFA--- policii.
Vykání jednotlivci je také ve větě (26), oproti větě (25) je tu konstrukce měla byste v přítomném (P) kondicionálu (C) aktiva (A), tvar byste (plurál je značkován v tagu) je pomocný. Konstrukce je ovšem systémově homonymní – může být i tvarem neutra plurálu. V tomto případě by samozřejmě nešlo o vykání jednotlivci a hodnota čísla ve verbtagu u tvaru měla by byla P, nikoli v.
(27) Nyní vám již nehrozí/VDA3SP, že byste/A----- byla/A----- zatčena/VCP2vP za Fairburnovu vraždu.
Věta (27) obsahuje vykání jednotlivci (v) v konstrukci byste byla zatčena s pasivním (P na 3. pozici) přítomným (P na 6. pozici) kondicionálem (C).
(28) Mám/VDA1SP v hlavě vymeteno/VOP-S-.
V rezultativní konstrukci mám vymeteno se symbolem O (= ostatní funkce trpného příčestí) vyjadřuje hodnota kategorie způsob (2. pozice verbtagu) u plnovýznamového tvaru vymeteno.
(29) Zchlazen/VOP-S- Priceovou odpovědí, Preston pomalu otáčí/VDA3SP hlavu, natáhne/VDA3SP se v kyčlích, znovu si nasadí/VDA3SP brýle a hledí/VDA3SP k baru.
V této větě má tvar trpného (P) příčestí zchlazen v singuláru (S) funkci doplňku – ten je značkován jako O.
Upozorněme ještě na případ, kdy 1. osoba u l-ového příčestí není morfosyntakticky určena tvarem pomocného slovesa být, nýbrž osobním zájmenem ve funkci podmětu:
(30) A já posloužila/VDA1SR jako vzor?
(31) … začal horský břeh konečně klesat a my se dostali/VDA1PR do složité spleti kopců a údolí.
Ve větě (30) určuje 1. osobu příčestí posloužila jenom osobní zájmeno já, ve větě (31) pouze osobní zájmeno my.
Značkování víceslovných slovesných tvarů umožňuje popsat stovky rozmanitých typů syntaktických struktur (typem rozumíme např. pasivní přítomný kondicionál 3. osoby plurálu), přičemž každý typ se projevuje nesčetnými slovoslednými a dalšími syntaktickými variacemi ve značkovaných větách (např. různá slova nacházející se mezi jednotlivými slovesnými tvary, která tvoří týž komplex). Mimo koordinaci slovesných tvarů (zvláště minulého a trpného příčestí a infinitivu), jež představuje z hlediska spolehlivého značkování největší problém (často totiž není snadné rozpoznat předěl mezi klauzemi, existuje neshoda ve víceslovném komplexu a další komplikace…), platí, že všechny tvary ve víceslovném slovesném komplexu se nacházejí v téže klauzi. Například při tvoření minulého času 1. a 2. osoby aktiva je jak tvar pomocného slovesa být, tak l-ové příčestí v téže klauzi, přičemž tato klauze může být nesouvislá, tj. může být z hlediska slovosledu přerušena jinou vnořenou klauzí či klauzemi – takové případy jsou ovšem poměrně řídké a představují pro značkování obtížný problém. V téže klauzi se jednotlivé součásti víceslovného komplexu typicky nacházejí blízko sebe (ovšem v různých slovosledných variantách), nejčastěji v těsné blízkosti, což velmi usnadňuje jejich spolehlivé automatické značkování (např. chtěl/VCA1SP bych/A----- to udělat; opravdu bych/A----- chtěl/VCA1SP ten film vidět). Platí, že čím jsou si jednotlivé součásti z hlediska slovosledu blíže, tím je takových struktur v korpusech více a tím je také snazší je spolehlivě značkovat. Čím dále jsou od sebe, tím strměji frekvence klesá.
Značkování tak může např. napomoci identifikaci slov (nejen tvarů tvořících víceslovný (složený) slovesný komplex) nacházejících se v téže klauzi. Obecně lze říci, že uživatel má v atributu verbtag vhodný nástroj ke zkoumání slovosledu v klauzi, může snáze než dosud zjišťovat, které slovní tvary se nacházejí mezi jednotlivými částmi slovesného komplexu toho či onoho morfosyntaktického typu v klauzi, nebo snáze zjišťovat, do jaké klauze patří trpné příčestí a s jakými pomocnými tvary tvoří slovesný význam (představené morfosyntaktické značkování však neidentifikuje například nějakou společnou značkou, že ta či ona skupina slovesných tvarů vytváří víceslovný slovesný tvar!). Uživatel může dále poměrně snadno zjišťovat frekvenci těch či oněch typů víceslovných slovesných tvarů nebo významů např. morfosyntakticky homonymních příčestí (příčestí jako součást kondicionálových,i indikativních či dalších struktur), frekvenci struktur opisného pasiva v kombinaci s číslem, osobou a jmenným rodem apod.
Je jasné, že automatické značkování zdaleka není bezchybné a uživatel musí k výsledkům značkování přistupovat kriticky. Problémy způsobují nejen poměrně snadno odstranitelné chyby, jichž se systém značkování v současné verzi dopouští, a které by se tedy neměly objevit v dalších verzích značkovaných korpusů, ale i to, že úkol značkovat víceslovné slovesné komplexy je složitý z povahy věci (volný slovosled, elipsy, vnořené klauze, morfologická homonymie jednotlivých slovesných tvarů…), a někdy není ani teoreticky jasné, jak by se ten či onen jev měl značkovat.
Některé jevy spjaté s morfosyntaktickým značkováním sloves tedy předvedená koncepce značkování (zatím) vzhledem ke složitosti syntaktických a dalších jevů nezachycuje. Je to například afirmace/negace víceslovného komplexu jako celku (afirmace/negace jednotlivých tvarů se určuje na 11. pozici v tagu). Patrně by automaticky bylo možné zachytit negaci v těchto větách:
(32) Nikdy bych/A----- nebyl/A----- věřil/VDA1SR, že jsem/VDA1SP schopen takhle někoho kopnout/VFA---.
(33) V živoucím městě bych/A----- byl/A----- nikdy nemohl/VDA1SR tolik pozorovat/VFA---.
kde celý víceslovný slovesný komplex vyjadřuje negaci, přičemž ve větě (32) se neguje pomocné sloveso nebyl, zatímco ve větě (33) naopak plnovýznamový tvar nemohl – obě v podstatě plně synonymní varianty čeština připouští. Problém však může nastat u jevu dvojí negace:
(34) Nikterak však nejsem/A----- nepřipraven/VDP1SP na těžké časy.
který vyjadřuje oslabenou afirmaci (litotes) a je otázka, zda tuto vlastnost komplexu připsat, a pokud ano, jak by to bylo spolehlivé. Uživatel je tedy při svých rešerších odkázán na kombinaci vlastností obsažených v tagu (kde je kromě negace i vid a další morfologické vlastnosti izolovaného slovesného tvaru) a v morfosyntaktickém verbtagu. Další problém nastává u konstrukcí, ve kterých můžeme negaci použít na různých místech, přičemž se význam mírně změní, jako v příkladech (35) a (36):
(35) Nebyl bych spal/VCA1SR.
(36) Byl bych nespal/VCA1SR.
Rovněž se neznačkují struktury s modálními a fázovými slovesy a struktur rezultativních, jelikož značkování by nemuselo být přijatelně spolehlivé. Například výskyty polyfunkčního slovesa mít a dát (se) (obě slovesa jsou modální i plnovýznamová) v modálním/nemodálním užití a jako součást víceslovného komplexu by byly pravděpodobně značkovány poměrně nespolehlivě.