AplikaceAplikace
Nastavení

Kondicionál

Segmentace na slova v (novo)českých UD rozděluje tvary abych, abys, …, kdybych, kdybys, … na dvě slova: spojku a kondicionálové bych, bys, by, bychom, byste. Podobně jsou rozděleny agregáty zájmena a pomocného jsi, např. sis je rozděleno na jsi si, ses na jsi se (prohozený slovosled oproti morfosledu uvnitř agregátu je motivován předpokládaným pořadím, kdyby byla vyslovena celá slova).

V novočeských datech jsou pomocné tvary bych, bys, bychom, byste značkovány jako AUX s lemmatem být a s rysy VerbForm=Fin, Mood=Cnd, Aspect=Imp, Number (Sing nebo Plur) a Person (1 nebo 2). Tvar by se liší tím, že nemá rys čísla. Původně v PDT neměl a v části dat stále nemá ani rys osoby; na některých místech byla doplněna skriptem 3. osoba, ale je to problematické kvůli výrazům jako „tomu by ses nesmál“. Teoreticky je možné říct, že samotné by je 3. osoba, ale v analytickém tvaru (který bude v UD rozdělen na „tomu by jsi se nesmál“) nad ní převáží 2. osoba dodaná tvarem jsi (podobně jako analytický minulý čas smál jsem se obsahuje přítomný tvar jsem). Druhou možností je vrátit se k tomu, že by na rozdíl od ostatních kondicionálových auxiliárů nenese rys osoby. Každopádně je ale potřeba i v rámci novočeských dat najít jednotný přístup a uvést data do pořádku.

Řekl bych, že ve staročeských datech je potřeba odlišit kondicionál od aoristu, aby kondicionál měl jakž takž stejnou anotaci od staré češtiny až do dneška, zatímco aorist postupně vymizí. Jestli to chápu správně, tak ani v nejstarším pokrytém období už nebyla homonymie mezi aoristem a kondicionálem stoprocentní? JP: Skoro byla, resp. byly tam dva rozdíly. Prvním je tvar 3. pl. (aorist má bychu, zatímco v kondicionálu jsou na bychu známé pouze 2 doklady, jinak je už všude jen by). Druhým rozdílem pak je, že samotný tvar by se mohl vyskytovat u jakékoli kombinace osoby a čísla, ale to nebylo moc časté, resp. časté je to jen v té třetí osobě a v 2. sg.

DZ: Příklad z encyklopedického slovníku: by ty byl chodil v cestě božie, byl by bydlil u věčném pokoji (Bar 3,13 BiblOl) 'Kdybys byl šel po cestě Boží, bydlel bys ve věčném pokoji'

DZ: Soudě podle citovaného hesla z encyklopedického slovníku, s ostatními tvary (bych, bysem, bysi, bys, bychvě, bychově, bychva, bychova, bysta, byšta, bychom, bychme, bychome, bychmy, bychomy, bysme, byste, byšte, bychu) by problém být neměl a určení osoby a čísla by u nich mělo být většinou jednoznačné (ještě s výjimkou homonymie 2. a 3. osoby duálu). JP: Souhlasím.

DZ: Momentálně se přikláním k značkování Person=2 a Number=Sing tam, kde u staročeského by je z kontextu jasné, že má tento význam. Mj. i proto, že ta homonymie pochází z aoristu, kde bychom osobu taky rozlišovali podle kontextu. Ve střední a nové češtině se zřejmě v tomto významu neobjeví.

DZ: Nejsem si ale jist, jak naložit s by, které neoznačuje samostatně 2. osobu singuláru. Může to být 3. osoba sg. nebo pl., popř. i du., někdy zřejmě 2. os pl., nebo to může být součást víceslovného výrazu (by (j)ste, by (j)si, by (j)sme, by jsem, by jsi se = by ses, by jsi si = by sis). Můžeme si říct, že osobu a číslo stanovíme podle kontextu pro samostatné by (bez přítomného tvaru jsem, jsi, …), ale není jasné, co pak máme udělat tam, kde je by doprovázeno přítomným tvarem. (JP: To by snad ve staré češtině ještě být nemělo, ve střední už možná ano, ale to celkem jedno: když děláme korpus až do současné češtiny, tak s tím počítat musíme.) Zkopírovat jeho osobu a číslo? Nebo osobu a číslo vynechat? Nebo nastavit „výchozí“ hodnoty pro singulár 3. osoby s tím, že přítomný tvar tyto hodnoty přebije? Momentálně se mi asi nejméně líbí možnost, že osobu a číslo úplně vynecháme, protože pak pro některé výskyty kondicionálu vyplněná bude a pro jiné ne. Na druhou stranu by to samozřejmě bylo jednodušší pro anotátory a také pro automatickou predikci UDPipem (zvlášť pokud bychom ustoupili i od 2 osoby sg. ve staré češtině, viz výše). Ale jsou i jiné části morfologie, kde podle kontextu rozlišujeme tvary, které jsou systematicky homonymní, takže by tohle nebylo jediné místo, kde mají anotátoři a predikční modely těžší práci.

L-ové příčestí má v novočeských datech VerbForm=Part, Voice=Act a Tense=Past bez ohledu na to, jestli je použito v minulém čase, nebo v kondicionálu. (K tomu má rysy polarity, čísla, rodu a případně životnosti.) Jde hlavně o jednoznačné určení slovního tvaru. Rysy, které by odpovídaly celému analytickému výrazu, se dají odvodit z kombinace rysů příčestí a pomocných sloves.

JP: Taky nevím, k čemu se přiklonit, nejjednodušší by asi bylo osobu ani číslo u by neanotovat vůbec (dělat to jen ve 2. sg. a jinde ne mi přijde trochu divné). Anebo to dělat všude podle smyslu. Asi bych se spíš přikláněl k tomu to nedělat nikde, ale fakt nevím.

DZ: Takže upravený návrh by byl 1) u tvaru by ve významu kondicionálu nikdy neanotovat osobu ani číslo; 2) u ostatních tvarů kondicionálového auxiliáru anotovat osobu a číslo podle významu; 3) u tvaru by ve funkci aoristu (včetně jeho použití v analytickém antepréteritu) anotovat Number=Sing a osobu 2. nebo 3. podle významu. OK? JP: Já jsem pro.