AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Poslední revizeObě strany příští revize
pojmy:lexikalni_hustota [2013/09/13 16:35] vaclavcvrcekpojmy:lexikalni_hustota [2013/09/15 00:13] vaclavcvrcek
Řádek 3: Řádek 3:
 Lexikální hustota (//lexical density//, Ld) je index klasifikující text nebo korpus s ohledem na poměr jeho obsahové a gramatické složky. Počítá se jako podíl počtu výskytů plnovýznamových slov (//Nlex//) k počtu výskytů všech slov ([[pojmy:token|tokenů]], //N//):  Lexikální hustota (//lexical density//, Ld) je index klasifikující text nebo korpus s ohledem na poměr jeho obsahové a gramatické složky. Počítá se jako podíl počtu výskytů plnovýznamových slov (//Nlex//) k počtu výskytů všech slov ([[pojmy:token|tokenů]], //N//): 
  
-$Ld = \frac{Nlex}{N} (\times 100)$+$$ Ld = \frac{Nlex}{N} (\times 100 \%$$
  
 přičemž za plnovýznamová slova (Nlex) se obvykle považují substantiva, adjektiva, verba a adverbia. Lexikální hustota může sloužit k základnímu poměřování textů, její slabinou je především lpění na jednotlivých grafických slovech jako na nositelích významu (tj. nezohledňování víceslovných jednotek) a na vymezení plnovýznamovosti jako takové (např. spojení dvou číslovek //půl druhé// označující v běžném úzu čas 13:30 je "víc plnovýznamové" než leckterá sémanticky vyprázdněná substantiva nebo slovesa). přičemž za plnovýznamová slova (Nlex) se obvykle považují substantiva, adjektiva, verba a adverbia. Lexikální hustota může sloužit k základnímu poměřování textů, její slabinou je především lpění na jednotlivých grafických slovech jako na nositelích významu (tj. nezohledňování víceslovných jednotek) a na vymezení plnovýznamovosti jako takové (např. spojení dvou číslovek //půl druhé// označující v běžném úzu čas 13:30 je "víc plnovýznamové" než leckterá sémanticky vyprázdněná substantiva nebo slovesa).
Řádek 9: Řádek 9:
 ==== Související odkazy ==== ==== Související odkazy ====
  
-<WRAP round box 49%>+<WRAP round box 50%>
 [[pojmy:token|Token]] • [[pojmy:zipf|Zipfovy zákony]] • [[pojmy:heaps|Heapsův zákon]] • [[ttr|Token-type ratio]] [[pojmy:token|Token]] • [[pojmy:zipf|Zipfovy zákony]] • [[pojmy:heaps|Heapsův zákon]] • [[ttr|Token-type ratio]]
 </WRAP> </WRAP>