AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:ipm [2015/01/21 21:23] Václav Cvrčekpojmy:ipm [2017/01/30 09:45] – uprava ipm Adrian Zasina
Řádek 1: Řádek 1:
-====== ipm ======+====== i.p.m. ======
  
-Zkratky **ipm** (z angl. instances per million), příp. **ppm** (z angl. parts per million) jsou jednotkami relativní [[pojmy:frekvence|frekvence]]. Vyjadřují průměrný počet výskytů jednotky nebo slova v hypotetickém textu/korpusu o délce 1 milion slov.+Zkratky **i.p.m.** (z angl. instances per million), příp. **p.p.m.** (z angl. parts per million) jsou jednotkami relativní [[pojmy:frekvence|frekvence]]. Vyjadřují průměrný počet výskytů jednotky nebo slova v hypotetickém textu/korpusu o délce 1 milion slov.
  
-Např. [[pojmy:word|slovní tvar]] //běžeckých// se ve stomilionovém korpusu [[cnk:syn2010|SYN2010]] objevuje 208krát, což odpovídá 1,72 ipm, tj. 1,72 výskytů na milion slov.+Např. [[pojmy:word|slovní tvar]] //běžeckých// se ve stomilionovém korpusu [[cnk:syn2010|SYN2010]] objevuje 208krát, což odpovídá 1,71 i.p.m., tj. 1,71 výskytů na milion slov.
  
-===== Využití ipm/ppm =====+===== Využití i.p.m./p.p.m. =====
  
 Hlavní výhodou relativizace frekvencí vzhledem k velikosti korpusu je možnost následného porovnání hodnot z nestejně velkých korpusů. Absolutní hodnoty totiž jsou v případě, že korpusy nemají stejnou velikost, matoucí. [[pojmy:word|Slovní tvar]] //stromek// nabývá v korpusech [[cnk:syn2010|SYN2010]] a [[cnk:oral2008|ORAL2008]] těchto hodnot: Hlavní výhodou relativizace frekvencí vzhledem k velikosti korpusu je možnost následného porovnání hodnot z nestejně velkých korpusů. Absolutní hodnoty totiž jsou v případě, že korpusy nemají stejnou velikost, matoucí. [[pojmy:word|Slovní tvar]] //stromek// nabývá v korpusech [[cnk:syn2010|SYN2010]] a [[cnk:oral2008|ORAL2008]] těchto hodnot:
  
 ^ ^ SYN2010 ^ ORAL2008 ^ ^ ^ SYN2010 ^ ORAL2008 ^
-Abs. frekvence |  440 |  6 | +Absol. frekvence |  440 |  6 | 
-Rel. frekvence (v ipm) |  3,62 |  4,45 |+Relat. frekvence (v i.p.m.) |  3,62 |  4,45 |
  
 Navzdory tomu, o čem vypovídají absolutní frekvence, po přihlédnutí k celkové velikosti korpusů (SYN2010 má 122 mil. pozic, zatímco ORAL2008 jenom 1,35 mil. pozic) je slovo //stromek// v korpusu ORAL2008 relativně častější. Navzdory tomu, o čem vypovídají absolutní frekvence, po přihlédnutí k celkové velikosti korpusů (SYN2010 má 122 mil. pozic, zatímco ORAL2008 jenom 1,35 mil. pozic) je slovo //stromek// v korpusu ORAL2008 relativně častější.
Řádek 17: Řádek 17:
 ==== Související odkazy ==== ==== Související odkazy ====
 <WRAP round box 50%> <WRAP round box 50%>
-[[pojmy:arf|ARF]] • [[pojmy:frekvence|Frekvence]] • [[kurz:chvala_korpusu#sociolingvisticke_promenneucitele_zaci_a_vek|Příklad srovnávání ipm]]+[[pojmy:arf|ARF]] • [[pojmy:frekvence|Frekvence]] • [[kurz:chvala_korpusu#sociolingvisticke_promenneucitele_zaci_a_vek|Příklad srovnávání i.p.m.]]
 </WRAP> </WRAP>