AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Poslední revizeObě strany příští revize
pojmy:ipm [2015/01/21 21:23] vaclavcvrcekpojmy:ipm [2021/02/22 19:54] – [Využití i.p.m./p.p.m.] dominikakovarikova
Řádek 1: Řádek 1:
-====== ipm ======+====== i.p.m. ======
  
-Zkratky **ipm** (z angl. instances per million), příp. **ppm** (z angl. parts per million) jsou jednotkami relativní [[pojmy:frekvence|frekvence]]. Vyjadřují průměrný počet výskytů jednotky nebo slova v hypotetickém textu/korpusu o délce 1 milion slov.+Zkratky **i.p.m.** (z angl. instances per million), příp. **p.p.m.** (z angl. parts per million) jsou jednotkami relativní [[pojmy:frekvence|frekvence]]. Vyjadřují průměrný počet výskytů jednotky nebo slova v hypotetickém textu/korpusu o délce 1 milion slov.
  
-Např. [[pojmy:word|slovní tvar]] //běžeckých// se ve stomilionovém korpusu [[cnk:syn2010|SYN2010]] objevuje 208krát, což odpovídá 1,72 ipm, tj. 1,72 výskytů na milion slov.+Např. [[pojmy:word|slovní tvar]] //běžeckých// se ve stomilionovém korpusu [[cnk:syn2010|SYN2010]] objevuje 208krát, což odpovídá 1,71 i.p.m., tj. 1,71 výskytů na milion slov.
  
-===== Využití ipm/ppm =====+===== Využití i.p.m./p.p.m. =====
  
-Hlavní výhodou relativizace frekvencí vzhledem k velikosti korpusu je možnost následného porovnání hodnot z nestejně velkých korpusů. Absolutní hodnoty totiž jsou v případě, že korpusy nemají stejnou velikost, matoucí. [[pojmy:word|Slovní tvar]] //stromek// nabývá v korpusech [[cnk:syn2010|SYN2010]] a [[cnk:oral2008|ORAL2008]] těchto hodnot:+Hlavní výhodou relativizace frekvencí vzhledem k velikosti korpusu je možnost následného porovnání hodnot z nestejně velkých korpusů. Absolutní hodnoty totiž jsou v případě, že korpusy nemají stejnou velikost, matoucí. [[pojmy:lemma|Lemma]] //oběd// nabývá v korpusech [[cnk:syn2020|SYN2020]] a [[cnk:ortofon|ORTOFON]] těchto hodnot:
  
-^ ^ SYN2010 ORAL2008 +^ ^ SYN2020 ORTOFON 
-Abs. frekvence |  440 |  6 | +Absolutní frekvence |  6 444 | 187 
-Rel. frekvence (v ipm) |  3,62 |  4,45 |+Relat. frekvence (v i.p.m.) |  52,89 |  151,23 |
  
-Navzdory tomu, o čem vypovídají absolutní frekvence, po přihlédnutí k celkové velikosti korpusů (SYN2010 má 122 mil. pozic, zatímco ORAL2008 jenom 1,35 mil. pozic) je slovo //stromek// v korpusu ORAL2008 relativně častější.+Navzdory tomu, o čem vypovídají absolutní frekvence, po přihlédnutí k celkové velikosti korpusů (SYN2020 má 122 mil. pozic, zatímco ORAL2008 jenom 1,24 mil. pozic) je slovo //oběd// v korpusu ORTOFON relativně častější.
  
 ==== Související odkazy ==== ==== Související odkazy ====
 <WRAP round box 50%> <WRAP round box 50%>
-[[pojmy:arf|ARF]] • [[pojmy:frekvence|Frekvence]] • [[kurz:chvala_korpusu#sociolingvisticke_promenneucitele_zaci_a_vek|Příklad srovnávání ipm]]+[[pojmy:arf|ARF]] • [[pojmy:frekvence|Frekvence]] • [[kurz:chvala_korpusu#sociolingvisticke_promenneucitele_zaci_a_vek|Příklad srovnávání i.p.m.]]
 </WRAP> </WRAP>