Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verze | Následující verzeObě strany příští revize | ||
pojmy:typ [2013/06/19 23:01] – vaclavcvrcek | pojmy:typ [2013/08/22 17:03] – alzbetavitkova | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Typ (type) ====== | ====== Typ (type) ====== | ||
- | Z hlediska korpusové lingvistiky je typ/type jednotka abstrakce, která vzniká v opozici k pojmu [[pojmy: | + | Z hlediska korpusové lingvistiky je typ/type jednotka abstrakce, která vzniká v opozici k pojmu [[pojmy: |
===== Poměr počtu typů a tokenů ===== | ===== Poměr počtu typů a tokenů ===== | ||
- | TTR (token-type ratio) je poměr počtu různých slov (typů) k celkovému počtu všech slov v korpusu (někdy vyjádřený v procentech). Pokud je poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování. | + | **TTR (token-type ratio)** je poměr počtu různých slov (typů) k celkovému počtu všech slov v korpusu (někdy vyjádřený v procentech). Pokud je poměr vysoký, můžeme mluvit o textu s velkou lexikální bohatostí (užívá mnoho různých jednotek), malý poměr značí velkou míru opakování. |
Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy: | Token-type jako ukazatel je silně vázaný na celkovou velikost korpusu, je proto jen obtížně využitelný jako obecný referenční ukazatel. Čím delší text máme k dispozici, tím větší je poměr mezi tokeny a typy (ačkoli vztah není lineární, viz [[pojmy: | ||
==== Související odkazy ==== | ==== Související odkazy ==== | ||
- | + | <WRAP round box 49%> | |
- | [[pojmy: | + | [[pojmy: |
- | + | </ | |
- | [[pojmy: | + | |
- | + | ||
- | [[pojmy: | + |