Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
hickok:problemy_lemmatizace [2024/10/22 09:56] – [Další problematické jevy] jiripergler | hickok:problemy_lemmatizace [2025/02/10 11:32] (aktuální) – [Další problematické jevy] jiripergler |
---|
| |
<fc #ff0000>junošě > jinoše (?) </fc> | <fc #ff0000>junošě > jinoše (?) </fc> |
| |
| <fc #ff0000>čtrmezcietma > čtyřimezidcietma ?? (je to výchozí podoba v ESSČ opatřená o monoftongizaci) </fc> |
| |
| |
===== Lemmatizace slov s přechodem k jinému flexivnímu typu ===== | ===== Lemmatizace slov s přechodem k jinému flexivnímu typu ===== |
<fc #ff0000>panošě > panoš</fc> | <fc #ff0000>panošě > panoš</fc> |
| |
<fc #ff0000>rámě > rameno (?)</fc> | <fc #ff0000>rámě > rameno (??? – formu rámě uvádí SSČ i Příručka, byť jako zastaralé)</fc> |
| |
<fc #ff0000>vojšče > vojště (ne vojsko); též f. vojska! </fc> | <fc #ff0000>vojšče > vojště (ne vojsko); též f. vojska! </fc> |
| |
<fc #ff0000>sžěliti > zžel**e**t</fc> | <fc #ff0000>sžěliti > zžel**e**t</fc> |
| |
| <fc #ff0000>pohřésti> pohřbít (??)</fc> |
| |
| <fc #ff0000>přěbřísti> přebrodit (??)</fc> |
==== adjektiva ==== | ==== adjektiva ==== |
| |
| |
<fc #ff0000>//vlastný// > //vlastní//</fc> | <fc #ff0000>//vlastný// > //vlastní//</fc> |
| |
| <fc #ff0000>//valní// > //valný//</fc> |
===== Lemmatizace homonymních tvarů odpovídajících více možným lemmatům ===== | ===== Lemmatizace homonymních tvarů odpovídajících více možným lemmatům ===== |
| |
| |
<fc #ff0000>malečko > maličko </fc> | <fc #ff0000>malečko > maličko </fc> |
| |
| <fc #ff0000>korfešt > kurfiřt </fc> |
| |
| <fc #ff0000>ež, jež (ve fci SCONJ) > že </fc> |
| |
| <fc #ff0000>zmisati > zmizet </fc> |
| |
| <fc #ff0000>úscký > ústecký </fc> |
====== Další problematické jevy ====== | ====== Další problematické jevy ====== |
přichodit: lematizovat jako přijít? JZ: to bych rozhodně nedělala vzhledem k rozdílnému vidu obou sloves; nč. lemma přijít bych nechala pro stč. přijíti | přichodit: lematizovat jako přijít? JZ: to bych rozhodně nedělala vzhledem k rozdílnému vidu obou sloves; nč. lemma přijít bych nechala pro stč. přijíti |
<fc #ff0000>**//věčšú//, tj. komparativ adjektiva**: lemmatizovat jako //veliký//? (Nebo jako //velký//??)</fc> | <fc #ff0000>**//věčšú//, tj. komparativ adjektiva**: lemmatizovat jako //veliký//? (Nebo jako //velký//??)</fc> |
| |
<fc #ff0000>**//kolivěk//**: lemmatizovat jako //koli// (?) </fc> | <fc #ff0000>**//kolivěk//**: lemmatizovat jako //koli// (?) </fc> DZ: V novočeských datech jsou oddělená lemata slov končících na //-koli// a //-koliv//, takže //-kolivěk// by klidně mohlo být oddělené taky. Mně by ve skutečnosti celkem dávalo smysl, kdyby to bylo sloučené, ale pak bych to musel sloučit i v těch ostatních treebancích. (A nevím, jestli pro to autoři morfologického slovníku měli nějaký důvod, resp. pokud se sloučí tohle, tak co dalšího by se ještě mělo zvážit.) |
| |
<fc #ff0000>**//obláščí//**: lemmatizovat jako //obláští//, nebo upravit na //obzvláštní//? dávám druhou možnost </fc> | <fc #ff0000>**//obláščí//**: lemmatizovat jako //obláští//, nebo upravit na //obzvláštní//? dávám druhou možnost </fc> |
| |
<fc #ff0000>**//tu//**: lemmatizovat adv. //tu// jako //tady//, nebo jako //tu//? </fc> | <fc #ff0000>**//tu//**: lemmatizovat adv. //tu// jako //tady//, nebo jako //tu//? </fc> DZ: Jako //tu//. |
| |
| <fc #ff0000>**//odtad//**: lemmatizovat jako //odtad//, nebo //odtud//? </fc> |
| |
| <fc #ff0000>**//velí//**: lemmatizovat jako //velký//, nebo ponechat lemma //velí//? </fc> |
| |
| <fc #ff0000> //vešde// > //všude//? </fc> |
| |
| <fc #ff0000> //nikte// > //nikdo//? </fc> |
| |
====== Problematické jevy řešené na schůzi 20. 3. 2024 ====== | ====== Problematické jevy řešené na schůzi 20. 3. 2024 ====== |