Toto je starší verze dokumentu!
Kondicionál
Segmentace na slova v (novo)českých UD rozděluje tvary abych, abys, …, kdybych, kdybys, … na dvě slova: spojku a kondicionálové bych, bys, by, bychom, byste. Podobně jsou rozděleny agregáty zájmena a pomocného jsi, např. sis je rozděleno na jsi si, ses na jsi se (prohozený slovosled oproti morfosledu uvnitř agregátu je motivován předpokládaným pořadím, kdyby byla vyslovena celá slova).
V novočeských datech jsou pomocné tvary bych, bys, bychom, byste značkovány jako AUX
s lemmatem být a s rysy VerbForm=Fin
, Mood=Cnd
, Aspect=Imp
, Number
(Sing
nebo Plur
) a Person
(1
nebo 2
). Tvar by se liší tím, že nemá rys čísla. Původně v PDT neměl a v části dat stále nemá ani rys osoby; na některých místech byla doplněna skriptem 3. osoba, ale je to problematické kvůli výrazům jako „tomu by ses nesmál“. Teoreticky je možné říct, že samotné by je 3. osoba, ale v analytickém tvaru (který bude v UD rozdělen na „tomu by jsi se nesmál“) nad ní převáží 2. osoba dodaná tvarem jsi (podobně jako analytický minulý čas smál jsem se obsahuje přítomný tvar jsem). Druhou možností je vrátit se k tomu, že by na rozdíl od ostatních kondicionálových auxiliárů nenese rys osoby. Každopádně je ale potřeba i v rámci novočeských dat najít jednotný přístup a uvést data do pořádku.
Řekl bych, že ve staročeských datech je potřeba odlišit kondicionál od aoristu, aby kondicionál měl jakž takž stejnou anotaci od staré češtiny až do dneška, zatímco aorist postupně vymizí. Jestli to chápu správně, tak ani v nejstarším pokrytém období už nebyla homonymie mezi aoristem a kondicionálem stoprocentní?
JP: ve stč. i střdč. by ale zdaleka nemusí být jen třetí osoba, zcela pravidelně je to i 2. os. sg. a leckdy i jiné možnosti, předpokládám, tak je otázka, jestli osobu řešit podle smyslu, nebo vůbec (a jak v té souvislosti řešit číslo).
DZ: Příklad z encyklopedického slovníku: by ty byl chodil v cestě božie, byl by bydlil u věčném pokoji (Bar 3,13 BiblOl) 'Kdybys byl šel po cestě Boží, bydlel bys ve věčném pokoji'
DZ: Soudě podle citovaného hesla z encyklopedického slovníku, s ostatními tvary (bych, bysem, bysi, bys, bychvě, bychově, bychva, bychova, bysta, byšta, bychom, bychme, bychome, bychmy, bychomy, bysme, byste, byšte, bychu) by problém být neměl a určení osoby a čísla by u nich mělo být většinou jednoznačné (ještě s výjimkou homonymie 2. a 3. osoby duálu).
DZ: Momentálně se přikláním k značkování Person=2
a Number=Sing
tam, kde u staročeského by je z kontextu jasné, že má tento význam. Mj. i proto, že ta homonymie pochází z aoristu, kde bychom osobu taky rozlišovali podle kontextu. Ve střední a nové češtině se zřejmě v tomto významu neobjeví.
DZ: Nejsem si ale jist, jak naložit s by, které neoznačuje samostatně 2. osobu singuláru. Může to být 3. osoba sg. nebo pl., popř. i du., někdy zřejmě 2. os pl., nebo to může být součást víceslovného výrazu (by (j)ste, by (j)si, by (j)sme, by jsem, by jsi se = by ses, by jsi si = by sis). Můžeme si říct, že osobu a číslo stanovíme podle kontextu pro samostatné by (bez přítomného tvaru jsem, jsi, …), ale není jasné, co pak máme udělat tam, kde je by doprovázeno přítomným tvarem. Zkopírovat jeho osobu a číslo? Nebo osobu a číslo vynechat? Nebo nastavit „výchozí“ hodnoty pro singulár 3. osoby s tím, že přítomný tvar tyto hodnoty přebije? Momentálně se mi asi nejméně líbí možnost, že osobu a číslo úplně vynecháme, protože pak pro některé výskyty kondicionálu vyplněná bude a pro jiné ne. Na druhou stranu by to samozřejmě bylo jednodušší pro anotátory a také pro automatickou predikci UDPipem (zvlášť pokud bychom ustoupili i od 2 osoby sg. ve staré češtině, viz výše). Ale jsou i jiné části morfologie, kde podle kontextu rozlišujeme tvary, které jsou systematicky homonymní, takže by tohle nebylo jediné místo, kde mají anotátoři a predikční modely těžší práci.
L-ové příčestí má v novočeských datech VerbForm=Part
, Voice=Act
a Tense=Past
bez ohledu na to, jestli je použito v minulém čase, nebo v kondicionálu. (K tomu má rysy čísla, rodu a případně životnosti.) Jde hlavně o jednoznačné určení slovního tvaru. Rysy, které by odpovídaly celému analytickému výrazu, se dají odvodit z kombinace rysů příčestí a pomocných sloves.