Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
pojmy:typ [2013/06/19 23:01] – vaclavcvrcek | pojmy:typ [2013/09/13 16:44] – Schvaleno pro 1. verzi vaclavcvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Typ (type) ====== | ====== Typ (type) ====== | ||
- | Z hlediska korpusové lingvistiky je typ/type jednotka abstrakce, která vzniká v opozici k pojmu [[pojmy: | + | Z hlediska korpusové lingvistiky je typ/type jednotka abstrakce, která vzniká v opozici k pojmu [[pojmy: |
===== Poměr počtu typů a tokenů ===== | ===== Poměr počtu typů a tokenů ===== | ||
- | TTR (token-type ratio) je poměr počtu různých slov (typů) k celkovému počtu všech slov v korpusu (někdy vyjádřený v procentech). Pokud je poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování. | + | **TTR (token-type ratio)** je poměr počtu různých slov (typů) k celkovému počtu všech slov v korpusu (někdy vyjádřený v procentech). Pokud je poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování. |
Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy: | Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy: | ||
Řádek 11: | Řádek 11: | ||
==== Související odkazy ==== | ==== Související odkazy ==== | ||
- | [[pojmy: | + | <WRAP round box 49%> |
- | + | [[pojmy: | |
- | [[pojmy: | + | </ |
- | + | ||
- | [[pojmy: | + |