Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Následující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
pojmy:typ [2013/06/18 18:23] – vytvořeno vaclavcvrcek | pojmy:typ [2013/09/13 16:44] – Schvaleno pro 1. verzi vaclavcvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Typ (type) ====== | ====== Typ (type) ====== | ||
- | Z hlediska korpusové lingvistiky je typ/type jednotka abstrakce, [[pojmy: | + | Z hlediska korpusové lingvistiky je typ/type jednotka abstrakce, |
===== Poměr počtu typů a tokenů ===== | ===== Poměr počtu typů a tokenů ===== | ||
- | TTR (token-type ratio) je poměr počtu různých slov (typů) k celkovému počtu všech slov v korpusu (někdy vyjádřený v procentech). Pokud je poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování. | + | **TTR (token-type ratio)** je poměr počtu různých slov (typů) k celkovému počtu všech slov v korpusu (někdy vyjádřený v procentech). Pokud je poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování. |
Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy: | Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy: | ||
+ | |||
+ | ==== Související odkazy ==== | ||
+ | |||
+ | <WRAP round box 49%> | ||
+ | [[pojmy: | ||
+ | </ |