Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
pojmy:frekvence [2016/09/30 18:44]
Václav Cvrček
pojmy:frekvence [2016/09/30 18:45] (aktuální)
Václav Cvrček [Využití a význam frekvence]
Řádek 103: Řádek 103:
 === Příklady === === Příklady ===
  
-Když v korpusu o velikosti zhruba 100 mil. slov (např. [[cnk:​syn2015|SYN2015]]) naměříme u zkoumaného jevu frekvenci 50 výskytů, je třeba takový výsledek interpretovat tak, že v populaci textů, kterou má tento korpus reprezentovat,​ se tento jev objevuje v rozmezí od 37 do 66 výskytů na 100 mil. textových slov (s 5% pravděpodobností omylu, tj. že reálný výsledek se bude nacházet vně tohoto intervalu). ​+Když v korpusu o velikosti zhruba 100 mil. slov (např. [[cnk:​syn2015|SYN2015]]) naměříme u zkoumaného jevu frekvenci 50 výskytů, je třeba takový výsledek interpretovat tak, že v populaci textů, kterou má tento korpus reprezentovat,​ se tento jev objevuje v rozmezí od 37 do 66 výskytů na 100 mil. textových slov (s 5% pravděpodobností omylu, tj. s rizikem, ​že reálný výsledek se bude nacházet vně tohoto intervalu). ​
  
 Zjistíme-li,​ že se hledaný jev v korpusu (např. v [[cnk:​oral2008|ORAL2008]]) vyskytuje právě třikrát, znamená to, že v jiném plně srovnatelném korpusu by tentýž jev mohl nabývat hodnoty až 9 výskytů nebo by v něm nemusel být přítomen vůbec (opět při 5% pravděpodobnosti chyby).((U takto nízkých hodnot záleží rovněž na zvoleném způsobu zaokrouhlování.)) Zjistíme-li,​ že se hledaný jev v korpusu (např. v [[cnk:​oral2008|ORAL2008]]) vyskytuje právě třikrát, znamená to, že v jiném plně srovnatelném korpusu by tentýž jev mohl nabývat hodnoty až 9 výskytů nebo by v něm nemusel být přítomen vůbec (opět při 5% pravděpodobnosti chyby).((U takto nízkých hodnot záleží rovněž na zvoleném způsobu zaokrouhlování.))