AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:word [2013/06/18 18:33] Václav Cvrčekpojmy:word [2013/09/13 16:49] (aktuální) – Schvaleno pro 1. verzi Václav Cvrček
Řádek 1: Řádek 1:
 ====== Slovní tvar (word) ====== ====== Slovní tvar (word) ======
  
-Slovní tvar (v korpusové terminologii běžně označovaný jako //word//) je jednotka, která si zachovává svoji morfologickou (a příp. i pravopisnou) specifičnost. Svojí obecností je mezi [[pojmy:token|tokenem]] a [[pojmy:lemma|lemmatem]].+Slovní tvar (v korpusové terminologii běžně označovaný jako //word//) je jednotka, která si zachovává svoji **morfologickou** (a příp. i **pravopisnou**) specifičnost. Svojí obecností je mezi [[pojmy:token|tokenem]] a [[pojmy:lemma|lemmatem]].
  
 Zatímco [[pojmy:token|token]] je jedna konkrétní realizace jednotky, slovní tvar je jednotka typizovaná, jedná se o [[pojmy:typ|typ]]. Např. slovní tvar //chceme// může mít velmi mnoho různých realizací (tokenů); v korpusu SYN2010 je jich 5627. Zatímco [[pojmy:token|token]] je jedna konkrétní realizace jednotky, slovní tvar je jednotka typizovaná, jedná se o [[pojmy:typ|typ]]. Např. slovní tvar //chceme// může mít velmi mnoho různých realizací (tokenů); v korpusu SYN2010 je jich 5627.
  
-Vedle toho [[pojmy:lemma|lemma]]je jednotka o úroveň abstrakce výš, protože odhlíží od morfologických a pravopisných charakteristik. Slovní tvary //chtít, chceme, chtěl, chtíti// mají stejné lemma //chtít//. Ve většině přístupů se navíc na úrovni slovních tvarů rozlišuje i velikost písmen (formy //chce//, //Chce// a //CHCE// jsou považovány za různé slovní tvary).+Vedle toho [[pojmy:lemma|lemma]] je jednotka o úroveň abstrakce výš, protože odhlíží od morfologických a pravopisných charakteristik. Slovní tvary //chtít, chceme, chtěl, chtíti// mají stejné lemma //chtít//. Ve většině přístupů se navíc na úrovni slovních tvarů rozlišuje i velikost písmen (formy //chce//, //Chce// a //CHCE// jsou považovány za různé slovní tvary). Na rozdíl od //lemmatu//, které je možné chápat jako množinu tvarů, je tedy //word// jen jediný tvar daného slova. 
 + 
 +==== Související odkazy ==== 
 + 
 +<WRAP round box 45%> 
 +[[pojmy:lemma|Lemma]] • [[pojmy:atributy_pozicni|Poziční atributy]] • [[pojmy:tag|Tag]] 
 +</WRAP>