AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:ipm [2013/06/10 17:48] vaclavcvrcekpojmy:ipm [2015/01/21 17:34] – Links adapted because of a move operation cvrcek
Řádek 4: Řádek 4:
  
 Např. [[pojmy:word|slovní tvar]] //běžeckých// se ve stomilionovém korpusu [[cnk:syn2010|SYN2010]] objevuje 208krát, což odpovídá 1,72 ipm, tj. 1,72 výskytů na milion slov. Např. [[pojmy:word|slovní tvar]] //běžeckých// se ve stomilionovém korpusu [[cnk:syn2010|SYN2010]] objevuje 208krát, což odpovídá 1,72 ipm, tj. 1,72 výskytů na milion slov.
 +
 +===== Využití ipm/ppm =====
 +
 +Hlavní výhodou relativizace frekvencí vzhledem k velikosti korpusu je možnost následného porovnání hodnot z nestejně velkých korpusů. Absolutní hodnoty totiž jsou v případě, že korpusy nemají stejnou velikost, matoucí. [[pojmy:word|Slovní tvar]] //stromek// nabývá v korpusech [[cnk:syn2010|SYN2010]] a [[cnk:oral2008|ORAL2008]] těchto hodnot:
 +
 +^ ^ SYN2010 ^ ORAL2008 ^
 +| Abs. frekvence |  440 |  6 |
 +| Rel. frekvence (v ipm) |  3,62 |  4,45 |
 +
 +Navzdory tomu, o čem vypovídají absolutní frekvence, po přihlédnutí k celkové velikosti korpusů (SYN2010 má 122 mil. pozic, zatímco ORAL2008 jenom 1,35 mil. pozic) je slovo //stromek// v korpusu ORAL2008 relativně častější.
 +
 +==== Související odkazy ====
 +<WRAP round box 49%>
 +[[pojmy:arf|ARF]] • [[pojmy:frekvence|Frekvence]] • [[kurz:chvala_korpusu#sociolingvisticke_promenneucitele_zaci_a_vek|Příklad srovnávání ipm]]
 +</WRAP>