AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Poslední revizeObě strany příští revize
pojmy:typ [2014/11/24 11:39] – [Poměr počtu typů a tokenů] Václav Cvrčekpojmy:typ [2014/11/24 11:40] Václav Cvrček
Řádek 5: Řádek 5:
 ===== Poměr počtu typů a tokenů ===== ===== Poměr počtu typů a tokenů =====
  
-**TTR (token-type ratio)** je poměr (někdy vyjádřený procenty) počtu různých slov (typů) k celkovému počtu všech slov v korpusu. Pokud je tento poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování.+**TTR (token-type ratio)** je poměr (někdy vyjádřený procenty) počtu různých slov nebo lemmat (typů) k celkovému počtu všech slov v korpusu. Pokud je tento poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování.
  
 Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy:heaps|Heapsův zákon]]). Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy:heaps|Heapsův zákon]]).