Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize | ||
pojmy:lemma [2013/08/22 14:39] – alzbetavitkova | pojmy:lemma [2020/12/17 11:42] – [Lemma] vladmirpetkevic | ||
---|---|---|---|
Řádek 4: | Řádek 4: | ||
Přístupy k lemmatizaci se mohou v drobnostech lišit, obecně však platí, že | Přístupy k lemmatizaci se mohou v drobnostech lišit, obecně však platí, že | ||
- | * lemma každého českého substantiva je jeho **nom. sg.** (tvary //lesům, lesy, lesích// | + | * lemma každého českého substantiva je jeho **nom. sg.** (tvary //lesům, lesy, lesích// |
- | * u adjektiv je to **nom. sg. mask.** (tvary // | + | * u adjektiv je to **nom. sg. mask. pozitiv** (tvary // |
- | * u sloves je to **infinitiv** (tvary //chodil, chodíš, chodíme// | + | * u zájmen je to **nom. sg. mask.** (tvary //ta, to, ti, tomu// mají lemma **//ten//**) |
+ | * u sloves je to **infinitiv** (tvary //chodil, chodíš, chodíme// | ||
Lemma jako jednotka vzniká abstrakcí morfologických vlastností [[pojmy: | Lemma jako jednotka vzniká abstrakcí morfologických vlastností [[pojmy: | ||
Řádek 16: | Řádek 17: | ||
===== Vztah lemmatu a významu ===== | ===== Vztah lemmatu a významu ===== | ||
- | Lemma by mělo být základním nositelem lexikálního významu jednotky. Na základě lemmatu jsou proto sestavovány korpusově založené slovníky. Vedle toho se ovšem stále více zdůrazňuje přístup, který poukazuje na fakt, že význam je úzce spjat s morfologicky vymezeným [[pojmy: | + | Lemma by mělo být základním nositelem lexikálního významu jednotky. Na základě lemmatu jsou proto sestavovány korpusově založené slovníky. Vedle toho se ovšem stále více zdůrazňuje přístup, který poukazuje na fakt, že význam je úzce spjat s morfologicky vymezeným [[pojmy: |
+ | |||
+ | ===== Hyperlemma a lemmatizace diachronních textů ===== | ||
+ | |||
+ | Přístup k lemmatizaci se může v odůvodněných případech lišit. Jedním z takových případů je zpracování [[pojmy: | ||
+ | |||
+ | V případě diachronního korpusu [[cnk: | ||
===== Lemmatizace ===== | ===== Lemmatizace ===== | ||
Řádek 35: | Řádek 42: | ||
==== Související odkazy ==== | ==== Související odkazy ==== | ||
- | <WRAP round box 49/> | + | |
- | [[pojmy: | + | <WRAP round box 49%> |
+ | [[pojmy: | ||
</ | </ |