Lexikální hustota

Lexikální hustota (lexical density, Ld) je index klasifikující text nebo korpus s ohledem na poměr jeho obsahové a gramatické složky. Počítá se jako podíl počtu výskytů plnovýznamových slov (Nlex) k počtu výskytů všech slov (tokenů, N):

$$ Ld = \frac{Nlex}{N} (\times 100 \%) $$

přičemž za plnovýznamová slova (Nlex) se obvykle považují substantiva, adjektiva, verba a adverbia. Lexikální hustota může sloužit k základnímu poměřování textů, její slabinou je především lpění na jednotlivých grafických slovech jako na nositelích významu (tj. nezohledňování víceslovných jednotek) a na vymezení plnovýznamovosti jako takové (např. spojení dvou číslovek půl druhé označující v běžném úzu čas 13:30 je „víc plnovýznamové“ než leckterá sémanticky vyprázdněná substantiva nebo slovesa).

Související odkazy

Token • Zipfovy zákony • Heapsův zákon • Token-type ratio

Historie: • lexikalni_hustota

Lexikální hustota

Související odkazy

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence