Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verze | |
pojmy:zipf [2013/08/22 17:07] – alzbetavitkova | pojmy:zipf [2013/09/13 16:52] (aktuální) – Schvaleno pro 1. verzi vaclavcvrcek |
---|
===== První Zipfův zákon ===== | ===== První Zipfův zákon ===== |
| |
Nejpoužívanější a nejznámější ze Zipfových zákonů je možné formalizovat vzorcem: $f \times r = k$, kde //f// je [[pojmy:frekvence|frekvence]] slova, //r// je jeho [[pojmy:frekvence#rank|rank]] (pořadí) a //k// je konstanta. | Nejpoužívanější a nejznámější z Zipfových zákonů je možné formalizovat vzorcem: $f \times r = k$, kde //f// je [[pojmy:frekvence|frekvence]] slova, //r// je jeho [[pojmy:frekvence#rank|rank]] (pořadí) a //k// je konstanta. |
| |
[{{:pojmy:zipf-capek-cast.png?300 |Výřez grafu zobrazujícího vztah mezi rankem a frekvencí slov v korpusu Karla Čapka}}] | [{{:pojmy:zipf-capek-cast.png?300|Výřez grafu zobrazujícího vztah mezi rankem a frekvencí slov v korpusu Karla Čapka}}] |
| [{{:pojmy:zipf-capek-cely.png?200|Logaritmické zobrazení vztahu mezi rankem a frekvencemi slov v korpusu Karla Čapka}}] |
| |
[[pojmy:frekvence|Frekvence]] slova je tedy nepřímo úměrná jeho [[pojmy:rank|ranku]]. Vztah vychází z předpokladu, že existuje tendence po ustavení rovnováhy mezi počtem slov v jazyce (rozrůzněnost jazyka) a jejich frekvencí (jazyková ekonomie). Důsledkem tohoto vztahu je fakt, že každý text obsahuje velmi malý počet slov frekventovaných a většinu slov málo frekventovaných (viz [[pojmy:hapax#prirustek_hapaxu|podíl hapaxů]] na celkovém počtu [[pojmy:typ|typů]]). | [[pojmy:frekvence|Frekvence]] slova je tedy nepřímo úměrná jeho [[pojmy:rank|ranku]]. Vztah vychází z předpokladu, že existuje tendence po ustavení rovnováhy mezi počtem slov v jazyce (rozrůzněnost jazyka) a jejich frekvencí (jazyková ekonomie). Důsledkem tohoto vztahu je fakt, že každý text obsahuje velmi malý počet slov frekventovaných a většinu slov málo frekventovaných (viz [[pojmy:hapax#prirustek_hapaxu|podíl hapaxů]] na celkovém počtu [[pojmy:typ|typů]]). |
| |
[{{:pojmy:zipf-capek-cely.png?300 |Logaritmické zobrazení vztahu mezi rankem a frekvencemi slov v korpusu Karla Čapka}}] | |
| |
===== Druhý Zipfův zákon ===== | ===== Druhý Zipfův zákon ===== |