Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
pojmy:zipf [2013/08/22 17:07]
alzbetavitkova
pojmy:zipf [2013/09/13 16:52] (aktuální)
Václav Cvrček Schvaleno pro 1. verzi
Řádek 7: Řádek 7:
 ===== První Zipfův zákon ===== ===== První Zipfův zákon =====
  
-Nejpoužívanější a nejznámější ​ze Zipfových zákonů je možné formalizovat vzorcem: $f \times r = k$, kde //f// je [[pojmy:​frekvence|frekvence]] slova, //r// je jeho [[pojmy:​frekvence#​rank|rank]] (pořadí) a //k// je konstanta. ​+Nejpoužívanější a nejznámější ​Zipfových zákonů je možné formalizovat vzorcem: $f \times r = k$, kde //f// je [[pojmy:​frekvence|frekvence]] slova, //r// je jeho [[pojmy:​frekvence#​rank|rank]] (pořadí) a //k// je konstanta. ​
  
-[{{:​pojmy:​zipf-capek-cast.png?​300 |Výřez grafu zobrazujícího vztah mezi rankem a frekvencí slov v korpusu Karla Čapka}}] ​+[{{:​pojmy:​zipf-capek-cast.png?​300|Výřez grafu zobrazujícího vztah mezi rankem a frekvencí ​slov v korpusu Karla Čapka}}]  
 +[{{:​pojmy:​zipf-capek-cely.png?​200|Logaritmické zobrazení vztahu mezi rankem a frekvencemi ​slov v korpusu Karla Čapka}}]
  
 [[pojmy:​frekvence|Frekvence]] slova je tedy nepřímo úměrná jeho [[pojmy:​rank|ranku]]. Vztah vychází z předpokladu,​ že existuje tendence po ustavení rovnováhy mezi počtem slov v jazyce (rozrůzněnost jazyka) a jejich frekvencí (jazyková ekonomie). Důsledkem tohoto vztahu je fakt, že každý text obsahuje velmi malý počet slov frekventovaných a většinu slov málo frekventovaných (viz [[pojmy:​hapax#​prirustek_hapaxu|podíl hapaxů]] na celkovém počtu [[pojmy:​typ|typů]]). [[pojmy:​frekvence|Frekvence]] slova je tedy nepřímo úměrná jeho [[pojmy:​rank|ranku]]. Vztah vychází z předpokladu,​ že existuje tendence po ustavení rovnováhy mezi počtem slov v jazyce (rozrůzněnost jazyka) a jejich frekvencí (jazyková ekonomie). Důsledkem tohoto vztahu je fakt, že každý text obsahuje velmi malý počet slov frekventovaných a většinu slov málo frekventovaných (viz [[pojmy:​hapax#​prirustek_hapaxu|podíl hapaxů]] na celkovém počtu [[pojmy:​typ|typů]]).
  
-[{{:​pojmy:​zipf-capek-cely.png?​300 |Logaritmické zobrazení vztahu mezi rankem a frekvencemi slov v korpusu Karla Čapka}}]+
  
 ===== Druhý Zipfův zákon ===== ===== Druhý Zipfův zákon =====