AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:zipf [2013/06/18 18:46] – vytvořeno vaclavcvrcekpojmy:zipf [2013/07/10 10:17] cvrcek
Řádek 6: Řádek 6:
  
 ===== První Zipfův zákon ===== ===== První Zipfův zákon =====
- 
  
 Nejpoužívanější a nejznámější z Zipfových zákonů je možné formalizovat vzorcem: $f \times r = k$, kde //f// je [[pojmy:frekvence|frekvence]] slova, //r// je jeho [[pojmy:frekvence#rank|rank]] (pořadí) a //k// je konstanta.  Nejpoužívanější a nejznámější z Zipfových zákonů je možné formalizovat vzorcem: $f \times r = k$, kde //f// je [[pojmy:frekvence|frekvence]] slova, //r// je jeho [[pojmy:frekvence#rank|rank]] (pořadí) a //k// je konstanta. 
 +
 +[{{:pojmy:zipf-capek-cast.png?300 |Výřez grafu zobrazujícího vztah mezi rankem a frekvencí slov v korpusu Karla Čapka}}] 
  
 Frekvence slova je tedy nepřímo úměrná jeho ranku. Vztah vychází z předpokladu, že existuje tendence po ustavení rovnováhy mezi počtem slov v jazyce (rozrůzněnost jazyka) a jejich frekvencí (jazyková ekonomie). Důsledkem tohoto vztahu je fakt, že každý text obsahuje velmi malý počet slov frekventovaných a většinu slov málo frekventovaných (viz [[pojmy:hapax#prirustek_hapaxu|podíl hapaxů]] na celkovém počtu [[pojmy:typ|typů]]). Frekvence slova je tedy nepřímo úměrná jeho ranku. Vztah vychází z předpokladu, že existuje tendence po ustavení rovnováhy mezi počtem slov v jazyce (rozrůzněnost jazyka) a jejich frekvencí (jazyková ekonomie). Důsledkem tohoto vztahu je fakt, že každý text obsahuje velmi malý počet slov frekventovaných a většinu slov málo frekventovaných (viz [[pojmy:hapax#prirustek_hapaxu|podíl hapaxů]] na celkovém počtu [[pojmy:typ|typů]]).
 +
 +[{{:pojmy:zipf-capek-cely.png?300 |Logaritmické zobrazení vztahu mezi rankem a frekvencemi slov v korpusu Karla Čapka}}]
  
 ===== Druhý Zipfův zákon ===== ===== Druhý Zipfův zákon =====
Řádek 19: Řádek 22:
  
 Poslední Zipfův zákon se týká vztahu mezi frekvencí slova a počtem jeho významů: $m / \sqrt{f} = k$, kde //m// je počet významů slova o frekvenci //f// a //k// je konstanta. Tento vztah se dá nejobtížnější empiricky ověřit, protože parcelace významů je vždy značně subjektivní. Principiálně tento Zipfův zákon vypovídá o tom, že slova s nejvyšší frekvencí bývají často polysémní, zatímco slova z nižších frekvenčních pásem mají často jen jeden význam. Poslední Zipfův zákon se týká vztahu mezi frekvencí slova a počtem jeho významů: $m / \sqrt{f} = k$, kde //m// je počet významů slova o frekvenci //f// a //k// je konstanta. Tento vztah se dá nejobtížnější empiricky ověřit, protože parcelace významů je vždy značně subjektivní. Principiálně tento Zipfův zákon vypovídá o tom, že slova s nejvyšší frekvencí bývají často polysémní, zatímco slova z nižších frekvenčních pásem mají často jen jeden význam.
 +
 +==== Související odkazy ====
 +
 +[[pojmy:frekvence|Frekvence]]
 +
 +[[pojmy:hapax|Hapax legomenon]]
 +
 +[[pojmy:heaps|Heapsův zákon]]