Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:word [2013/06/19 22:58] – vaclavcvrcek | pojmy:word [2013/09/13 16:49] (aktuální) – Schvaleno pro 1. verzi vaclavcvrcek |
---|
====== Slovní tvar (word) ====== | ====== Slovní tvar (word) ====== |
| |
Slovní tvar (v korpusové terminologii běžně označovaný jako //word//) je jednotka, která si zachovává svoji morfologickou (a příp. i pravopisnou) specifičnost. Svojí obecností je mezi [[pojmy:token|tokenem]] a [[pojmy:lemma|lemmatem]]. | Slovní tvar (v korpusové terminologii běžně označovaný jako //word//) je jednotka, která si zachovává svoji **morfologickou** (a příp. i **pravopisnou**) specifičnost. Svojí obecností je mezi [[pojmy:token|tokenem]] a [[pojmy:lemma|lemmatem]]. |
| |
Zatímco [[pojmy:token|token]] je jedna konkrétní realizace jednotky, slovní tvar je jednotka typizovaná, jedná se o [[pojmy:typ|typ]]. Např. slovní tvar //chceme// může mít velmi mnoho různých realizací (tokenů); v korpusu SYN2010 je jich 5627. | Zatímco [[pojmy:token|token]] je jedna konkrétní realizace jednotky, slovní tvar je jednotka typizovaná, jedná se o [[pojmy:typ|typ]]. Např. slovní tvar //chceme// může mít velmi mnoho různých realizací (tokenů); v korpusu SYN2010 je jich 5627. |
| |
Vedle toho [[pojmy:lemma|lemma]], je jednotka o úroveň abstrakce výš, protože odhlíží od morfologických a pravopisných charakteristik. Slovní tvary //chtít, chceme, chtěl, chtíti// mají stejné lemma //chtít//. Ve většině přístupů se navíc na úrovni slovních tvarů rozlišuje i velikost písmen (formy //chce//, //Chce// a //CHCE// jsou považovány za různé slovní tvary). | Vedle toho [[pojmy:lemma|lemma]] je jednotka o úroveň abstrakce výš, protože odhlíží od morfologických a pravopisných charakteristik. Slovní tvary //chtít, chceme, chtěl, chtíti// mají stejné lemma //chtít//. Ve většině přístupů se navíc na úrovni slovních tvarů rozlišuje i velikost písmen (formy //chce//, //Chce// a //CHCE// jsou považovány za různé slovní tvary). Na rozdíl od //lemmatu//, které je možné chápat jako množinu tvarů, je tedy //word// jen jediný tvar daného slova. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
[[pojmy:lemma|Lemma]] | <WRAP round box 45%> |
| [[pojmy:lemma|Lemma]] • [[pojmy:atributy_pozicni|Poziční atributy]] • [[pojmy:tag|Tag]] |
[[pojmy:atributy_pozicni|Poziční atributy]] | </WRAP> |
| |
[[pojmy:tag|Tag]] | |