AplikaceAplikace
Nastavení

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revisionBoth sides next revision
en:pojmy:ipm [2016/06/13 09:29] – created veronikapojarovaen:pojmy:ipm [2016/06/13 09:32] – [Využití ipm/ppm] veronikapojarova
Line 5: Line 5:
 Eg. The [[en:pojmy:word|node form]] //běžeckých// in the hundred million word corpus [[en:cnk:syn2010|SYN2010]] occurs 208 times, which is the equivalent of 1,72 ipm, i.e. 1,72 occurences per million words. Eg. The [[en:pojmy:word|node form]] //běžeckých// in the hundred million word corpus [[en:cnk:syn2010|SYN2010]] occurs 208 times, which is the equivalent of 1,72 ipm, i.e. 1,72 occurences per million words.
  
-===== Využití ipm/ppm =====+===== Use of ipm/ppm =====
  
-Hlavní výhodou relativizace frekvencí vzhledem k velikosti korpusu je možnost následného porovnání hodnot z nestejně velkých korpusůAbsolutní hodnoty totiž jsou v případěže korpusy nemají stejnou velikost, matoucí. [[pojmy:word|Slovní tvar]] //stromek// nabývá v korpusech [[cnk:syn2010|SYN2010]] [[cnk:oral2008|ORAL2008]] těchto hodnot:+The main advantage of relativization of frequency based on corpus size enables us to compare numbers from corpora of various sizesIn the case that corpora are not the same sizeabsolute values can cause confusionThe [[en:pojmy:word|node form]] //stromek// in the corpora[[en:cnk:syn2010|SYN2010]] and [[en:cnk:oral2008|ORAL2008]] reaches these values:
  
 ^ ^ SYN2010 ^ ORAL2008 ^ ^ ^ SYN2010 ^ ORAL2008 ^
-| Abs. frekvence |  440 |  6 | +| Abs. frequency |  440 |  6 | 
-| Rel. frekvence (ipm) |  3,62 |  4,45 |+| Rel. frequency (in ipm) |  3,62 |  4,45 |
  
 Navzdory tomu, o čem vypovídají absolutní frekvence, po přihlédnutí k celkové velikosti korpusů (SYN2010 má 122 mil. pozic, zatímco ORAL2008 jenom 1,35 mil. pozic) je slovo //stromek// v korpusu ORAL2008 relativně častější. Navzdory tomu, o čem vypovídají absolutní frekvence, po přihlédnutí k celkové velikosti korpusů (SYN2010 má 122 mil. pozic, zatímco ORAL2008 jenom 1,35 mil. pozic) je slovo //stromek// v korpusu ORAL2008 relativně častější.