AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:lemtag_mluv [2017/06/01 11:14] – [Podoba lemmatu] Zuzana Komrskovácnk:lemtag_mluv [2017/07/10 08:29] (aktuální) – [Literatura] Zuzana Komrsková
Řádek 40: Řádek 40:
 ===== Podoba lemmatu ===== ===== Podoba lemmatu =====
  
-  * většina slov má lemma v podobě **spisovného lemmatu**, tedy stejnou jako v psaném jazyce, a to i v případech, kdy regionální podoba frekvenčně převažuje (např. pod lemma **týden** spadají všechny tvary regionálních variant //tejden, tydeň, tédeň//+  * většina slov má lemma v podobě **spisovného lemmatu**, tedy stejnou jako v psaném jazyce, a to i v případech, kdy regionální podoba frekvenčně převažuje (např. pod lemma **//týden//** spadají všechny tvary regionálních variant //tejden, tyden, tydeň, tédeň//
-  * slova s** dvojí spisovnou podobou** mají dvojité lemma (//polívka/polévka//+  * slova s** dvojí spisovnou podobou** mají vícenásobné lemma (//polívka/polévka//
-  * slova, u nichž **nelze jednoznačně přiřadit jednotlivé tvary**, mají také dvojité lemma (//myslet/myslit, muset/musit//+  * slova, u nichž **nelze jednoznačně přiřadit jednotlivé tvary**, mají také vícenásobné lemma (//myslet/myslit, muset/musit//
-  * **zkratky** mají dvojité lemma: //SMS/esemeska, endéer/NDR// +  * **zkratky** mají vícenásobné lemma: //SMS/esemeska, endéer/NDR// 
  
-Dvojité lemma funguje jako multihodnota, to znamená, že při zadání jedné z možností vždy dostaneme všechny tvary přiřazené k dvojitému lemmatu.+Vícenásobné lemma funguje jako multihodnota, to znamená, že při zadání jedné z možností vždy dostaneme všechny tvary přiřazené k vícenásobnému lemmatu.
  
  
Řádek 57: Řádek 57:
   * **M** pro komentáře (vždy uvedené v kulatých závorkách)   * **M** pro komentáře (vždy uvedené v kulatých závorkách)
  
 +===== Poděkování =====
 +Rádi bychom poděkovali za konzultace doc. Kláře Osolsobě a Mgr. Daně Hlaváčkové, Ph.D. 
  
 ===== Literatura ===== ===== Literatura =====
Řádek 62: Řádek 64:
 <WRAP round tip 70%> <WRAP round tip 70%>
  
-Kopřivová, M. - Lukeš, D. - Komrsková, Z. - Poukarová, P.: Korpus ORAL: sestavení, lemmatizace a morfologické značkování. In //Korpus - Gramatika - Axiologie// 2017 (v tisku).+Kopřivová, M. - Lukeš, D. - Komrsková, Z. - Poukarová, P. (2017): Korpus ORAL: sestavení, lemmatizace a morfologické značkování. In //Korpus - Gramatika - Axiologie//, 15, 47-67.
  
 Lukeš. D. - Klimešová, P. - Komrsková, Z. - Kopřivová, M. (2015) : Experimental Tagging of the ORAL Series Corpora: Insights on Using a Stochastic Tagger. In: TSD 2015, Ed. P. Král a V. Matoušek. Springer international Publishing, 342-350. Lukeš. D. - Klimešová, P. - Komrsková, Z. - Kopřivová, M. (2015) : Experimental Tagging of the ORAL Series Corpora: Insights on Using a Stochastic Tagger. In: TSD 2015, Ed. P. Král a V. Matoušek. Springer international Publishing, 342-350.