AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
hickok:problemy_morfologie [2026/05/12 08:23] jiriperglerhickok:problemy_morfologie [2026/05/12 08:58] (aktuální) – [Vyřešené problémy] jiripergler
Řádek 98: Řádek 98:
 | JP, 18. 2. 2025 ^ zkratka cizího slova (//etc.//) | Jak zacházet s výrazem //etc.//? Bral bych to jako cizí slovo v našem pojetí, zároveň je to zkratka. Nabízí se tedy nechat lemma "etc", dát POS=X a Foreign=Yes (jako u cizích slov), zároveň vyplnit i Abbr=Yes. Ale bylo by to v rozporu s instrukcí, že u cizích slov se žádné jiné rysy než Foreign=Yes nevyplňují. Jak to tedy řešit? <fc #008000>**DZ:** Pokud s tím zacházíme jako s cizím slovem, tak není důvod anotovat zkratku. (Resp. ten důvod není o nic větší, než by byl důvod anotovat rod, číslo a pád u latinského substantiva.) Akorát je otázka, zda to nemohlo být dočasně v češtině zdomácnělé, než to vytlačila česká zkratka //atd.//? Např. v anglických UD se to za zdomácnělé považuje, protože se to tam používá dodneška, přestože je to z latiny.</fc> **JP:** Mně přijde, že by se to klidně dalo považovat za zdomácnělé i v současné češtině. Ale v té staré nevím, třeba slovník staré češtiny (ESSČ) to neuvádí, takže to asi za zdomácnělé úplně nepovažuje. Každopádně by v tom případě vyvstala otázka, jak to anotovat. Takže je potřeba buď stanovit, že to budeme brát jako běžné cizí slovo a Abbr nevyplňovat, nebo si říct, že je to zdomácnělé, a pak stanovit, jak to anotovat. <fc #008000>**DZ:** Mně by taky nevadilo považovat to za zdomácnělé i v nové češtině, ale když jsem hledal výskyty v UD treebancích, tak jsem akorát zjistil, že existuje nějaká kapela, co se jmenuje ETC, to je vše. Pokud to budeme anotovat jako zdomácnělé, pak mi přijde nejpřirozenější dělat to stejně jako //atd.//, což znamená UPOS=ADV, Abbr=Yes.</fc> **JP:** No a asi ještě Degree a Polarity, když tu děláme u všech adverbií kromě zájmenných a číslovkových, ne? A lemma "etc"? <fc #008000>**DZ:** Lemma "etc" asi ano. O tom Degree a Polarity nejsem přesvědčen (protože jiným zkratkám taky často chybí rysy, které se u nezkráceného slova vyskytují), ale klidně ho tam teď anotujme, ono to stejně bude vždycky Degree=Pos a Polarity=Pos. Nevím z hlavy, jestli to kontrolní skript bude vyžadovat nebo naopak zakazovat, ale pokud na to narazíme, tak mi to určitě připomeneš a já to nějak vyřeším.</fc> | Značit jako ADV. | | JP, 18. 2. 2025 ^ zkratka cizího slova (//etc.//) | Jak zacházet s výrazem //etc.//? Bral bych to jako cizí slovo v našem pojetí, zároveň je to zkratka. Nabízí se tedy nechat lemma "etc", dát POS=X a Foreign=Yes (jako u cizích slov), zároveň vyplnit i Abbr=Yes. Ale bylo by to v rozporu s instrukcí, že u cizích slov se žádné jiné rysy než Foreign=Yes nevyplňují. Jak to tedy řešit? <fc #008000>**DZ:** Pokud s tím zacházíme jako s cizím slovem, tak není důvod anotovat zkratku. (Resp. ten důvod není o nic větší, než by byl důvod anotovat rod, číslo a pád u latinského substantiva.) Akorát je otázka, zda to nemohlo být dočasně v češtině zdomácnělé, než to vytlačila česká zkratka //atd.//? Např. v anglických UD se to za zdomácnělé považuje, protože se to tam používá dodneška, přestože je to z latiny.</fc> **JP:** Mně přijde, že by se to klidně dalo považovat za zdomácnělé i v současné češtině. Ale v té staré nevím, třeba slovník staré češtiny (ESSČ) to neuvádí, takže to asi za zdomácnělé úplně nepovažuje. Každopádně by v tom případě vyvstala otázka, jak to anotovat. Takže je potřeba buď stanovit, že to budeme brát jako běžné cizí slovo a Abbr nevyplňovat, nebo si říct, že je to zdomácnělé, a pak stanovit, jak to anotovat. <fc #008000>**DZ:** Mně by taky nevadilo považovat to za zdomácnělé i v nové češtině, ale když jsem hledal výskyty v UD treebancích, tak jsem akorát zjistil, že existuje nějaká kapela, co se jmenuje ETC, to je vše. Pokud to budeme anotovat jako zdomácnělé, pak mi přijde nejpřirozenější dělat to stejně jako //atd.//, což znamená UPOS=ADV, Abbr=Yes.</fc> **JP:** No a asi ještě Degree a Polarity, když tu děláme u všech adverbií kromě zájmenných a číslovkových, ne? A lemma "etc"? <fc #008000>**DZ:** Lemma "etc" asi ano. O tom Degree a Polarity nejsem přesvědčen (protože jiným zkratkám taky často chybí rysy, které se u nezkráceného slova vyskytují), ale klidně ho tam teď anotujme, ono to stejně bude vždycky Degree=Pos a Polarity=Pos. Nevím z hlavy, jestli to kontrolní skript bude vyžadovat nebo naopak zakazovat, ale pokud na to narazíme, tak mi to určitě připomeneš a já to nějak vyřeším.</fc> | Značit jako ADV. |
 |JP, 19. 7. 2025 ^ rod u číslovek typu Sets | Vím, že v pravidlech máme napsáno, že u číslovek typu jedny, dvoje, troje, čtvery, oboje se nemá anotovat rod a životnost. (Pokud to tam anotujeme, skript nám to hlásí jako chybu.) Ale nevím, jestli je to dobré řešení, protože ve starší češtině se ten rod rozlišoval, máme např. dvoji vs. dvoje, oboji vs. oboje apod. Navíc opozice jedni vs. jedny existuje i v současné češtině, nejen v té starší. Neměli bychom tedy ten rod anotovat? (Lemma máme podle současných pokynů dávat jako "jedny", "dvoje" apod., k tomu viz i zde níže.)  | U NumType=Sets anotovat Gender (+Animacy v případě Gender=Masc). | |JP, 19. 7. 2025 ^ rod u číslovek typu Sets | Vím, že v pravidlech máme napsáno, že u číslovek typu jedny, dvoje, troje, čtvery, oboje se nemá anotovat rod a životnost. (Pokud to tam anotujeme, skript nám to hlásí jako chybu.) Ale nevím, jestli je to dobré řešení, protože ve starší češtině se ten rod rozlišoval, máme např. dvoji vs. dvoje, oboji vs. oboje apod. Navíc opozice jedni vs. jedny existuje i v současné češtině, nejen v té starší. Neměli bychom tedy ten rod anotovat? (Lemma máme podle současných pokynů dávat jako "jedny", "dvoje" apod., k tomu viz i zde níže.)  | U NumType=Sets anotovat Gender (+Animacy v případě Gender=Masc). |
-|jz, 3. 9. 2025 ^ //prvnější// | //poněvadž skrze potomnější skutek zdvižen bývá prvnější//: u slova //prvnější// patrně anotovat degree=cmp - a v tom případě anotovat i numtype=ord, nebo ne? **JP:** To je asi dotaz hlavně na Dana, ale skoro bych předpokládal, že v tomto případě bude potřeba rezignovat na tu číslovkovost a dát Degree=Cmp, Polarity=Pos, zatímco NumType nedávat. **JZ:** Nebo povolit kombinaci Degree=Cmp a NumType=Ord? :-) | Anotujeme jako řadovou číslovku a navíc rys Degree=Cmp. (Kombinace Degree=Cmp a NumType=Ord byla povolena. +|jz, 3. 9. 2025 ^ //prvnější// | //poněvadž skrze potomnější skutek zdvižen bývá prvnější//: u slova //prvnější// patrně anotovat degree=cmp - a v tom případě anotovat i numtype=ord, nebo ne? **JP:** To je asi dotaz hlavně na Dana, ale skoro bych předpokládal, že v tomto případě bude potřeba rezignovat na tu číslovkovost a dát Degree=Cmp, Polarity=Pos, zatímco NumType nedávat. **JZ:** Nebo povolit kombinaci Degree=Cmp a NumType=Ord? :-) | Anotujeme jako řadovou číslovku a navíc rys Degree=Cmp. Podobně  //najprvnější// je řadová číslovka a Degree=Sup. (Kombinace Degree a NumType=Ord byla povolena.