AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
hickok:problemy_lemmatizace [2024/10/22 10:08] – [adjektiva] jiriperglerhickok:problemy_lemmatizace [2025/02/10 11:32] (aktuální) – [Další problematické jevy] jiripergler
Řádek 44: Řádek 44:
  
 <fc #ff0000>junošě > jinoše (?) </fc> <fc #ff0000>junošě > jinoše (?) </fc>
 +
 +<fc #ff0000>čtrmezcietma > čtyřimezidcietma ?? (je to výchozí podoba v ESSČ opatřená o monoftongizaci) </fc>
 +
  
 ===== Lemmatizace slov s přechodem k jinému flexivnímu typu  ===== ===== Lemmatizace slov s přechodem k jinému flexivnímu typu  =====
Řádek 59: Řádek 62:
 <fc #ff0000>panošě > panoš</fc> <fc #ff0000>panošě > panoš</fc>
  
-<fc #ff0000>rámě > rameno (?)</fc>+<fc #ff0000>rámě > rameno (??? – formu rámě uvádí SSČ i Příručka, byť jako zastaralé)</fc>
  
 <fc #ff0000>vojšče > vojště (ne vojsko); též f. vojska! </fc> <fc #ff0000>vojšče > vojště (ne vojsko); též f. vojska! </fc>
Řádek 86: Řádek 89:
  
 <fc #ff0000>sžěliti > zžel**e**t</fc> <fc #ff0000>sžěliti > zžel**e**t</fc>
 +
 +<fc #ff0000>pohřésti> pohřbít (??)</fc>
 +
 +<fc #ff0000>přěbřísti> přebrodit (??)</fc>
 ==== adjektiva ==== ==== adjektiva ====
  
Řádek 158: Řádek 165:
  
 <fc #ff0000>malečko > maličko </fc> <fc #ff0000>malečko > maličko </fc>
 +
 +<fc #ff0000>korfešt > kurfiřt </fc>
 +
 +<fc #ff0000>ež, jež (ve fci SCONJ) > že </fc>
 +
 +<fc #ff0000>zmisati > zmizet </fc>
 +
 +<fc #ff0000>úscký > ústecký </fc>
 ====== Další problematické jevy ====== ====== Další problematické jevy ======
 přichodit: lematizovat jako přijít? JZ: to bych rozhodně nedělala vzhledem k rozdílnému vidu obou sloves; nč. lemma přijít bych nechala pro stč. přijíti přichodit: lematizovat jako přijít? JZ: to bych rozhodně nedělala vzhledem k rozdílnému vidu obou sloves; nč. lemma přijít bych nechala pro stč. přijíti
Řádek 176: Řádek 191:
 <fc #ff0000>**//věčšú//, tj. komparativ adjektiva**: lemmatizovat jako //veliký//? (Nebo jako //velký//??)</fc> <fc #ff0000>**//věčšú//, tj. komparativ adjektiva**: lemmatizovat jako //veliký//? (Nebo jako //velký//??)</fc>
  
-<fc #ff0000>**//kolivěk//**: lemmatizovat jako //koli// (?) </fc>+<fc #ff0000>**//kolivěk//**: lemmatizovat jako //koli// (?) </fc> DZ: V novočeských datech jsou oddělená lemata slov končících na //-koli// a //-koliv//, takže //-kolivěk// by klidně mohlo být oddělené taky. Mně by ve skutečnosti celkem dávalo smysl, kdyby to bylo sloučené, ale pak bych to musel sloučit i v těch ostatních treebancích. (A nevím, jestli pro to autoři morfologického slovníku měli nějaký důvod, resp. pokud se sloučí tohle, tak co dalšího by se ještě mělo zvážit.)
  
 <fc #ff0000>**//obláščí//**: lemmatizovat jako //obláští//, nebo upravit na //obzvláštní//? dávám druhou možnost </fc> <fc #ff0000>**//obláščí//**: lemmatizovat jako //obláští//, nebo upravit na //obzvláštní//? dávám druhou možnost </fc>
  
-<fc #ff0000>**//tu//**: lemmatizovat adv. //tu// jako //tady//, nebo jako //tu//? </fc>+<fc #ff0000>**//tu//**: lemmatizovat adv. //tu// jako //tady//, nebo jako //tu//? </fc> DZ: Jako //tu//. 
 + 
 +<fc #ff0000>**//odtad//**: lemmatizovat jako //odtad//, nebo //odtud//? </fc> 
 + 
 +<fc #ff0000>**//velí//**: lemmatizovat jako //velký//, nebo ponechat lemma //velí//? </fc> 
 + 
 +<fc #ff0000> //vešde// > //všude//? </fc> 
 + 
 +<fc #ff0000> //nikte// > //nikdo//? </fc>
  
 ====== Problematické jevy řešené na schůzi 20. 3. 2024 ====== ====== Problematické jevy řešené na schůzi 20. 3. 2024 ======