Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
kurz:nahodne_vzorky [2017/10/25 13:56]
Václav Cvrček [Studentovo rozdělení]
kurz:nahodne_vzorky [2019/04/05 09:56] (aktuální)
Václav Cvrček [Binomické rozdělení]
Řádek 70: Řádek 70:
 ===== Binomické rozdělení ===== ===== Binomické rozdělení =====
  
-Pro odhad absolutní četnosti výskytu sledovaného jevu se nejlépe hodí hypergeometrické rozdělení, které je ovšem výpočetně poměrně složité. V případě vysokého počtu dat v základním souboru a relativně malého rozsahu výběru vzorku (poměr větší než 10:1) můžeme s úspěchem použít aproximaci [[wp>Binomial_distribution|binomickým rozdělením]], které je méně náročnější na výpočet. Pro ilustraci, binomické rozdělení se používá v případech modelové situace házení kostkou, kdy v několika nezávislých pokusech za sebou zjišťujeme četnost hození šestky.+Pro odhad absolutní četnosti výskytu sledovaného jevu se nejlépe hodí hypergeometrické rozdělení, které je ovšem výpočetně poměrně složité. V případě vysokého počtu dat v základním souboru a relativně malého rozsahu výběru vzorku (poměr větší než 10:1) můžeme s úspěchem použít aproximaci [[wp>Binomial_distribution|binomickým rozdělením]], které je méně náročné na výpočet. Pro ilustraci, binomické rozdělení se používá v případech modelové situace házení kostkou, kdy v několika nezávislých pokusech za sebou zjišťujeme četnost hození šestky.
  
 Mějme opět velikost základního vzorku //N//, neznámý počet výrazů //M// s hledanou vlastností. Jeho odhad provedeme na základě prostého náhodného výběru slov ze základního vzorku; rozsah vzorků budeme označovat //n//. Mějme opět velikost základního vzorku //N//, neznámý počet výrazů //M// s hledanou vlastností. Jeho odhad provedeme na základě prostého náhodného výběru slov ze základního vzorku; rozsah vzorků budeme označovat //n//.
Řádek 78: Řádek 78:
   - absolutní četnosti prvku s danou vlastností tj. parametru //M//.   - absolutní četnosti prvku s danou vlastností tj. parametru //M//.
  
-Označíme-li //X// součet vybraných slov s hledanou vlastností ve výběru, pak odhad //p// je //p'//,které vypočteme //p'= X / n//, odhad absolutní četnosti //M' = N × X / n = N × p'//.+Označíme-li //X// součet vybraných slov s hledanou vlastností ve výběru, pak odhad //p// je //p'//, které vypočteme //p'= X / n//, odhad absolutní četnosti //M' = N × X / n = N × p'//.
  
 Interval spolehlivosti je oblast, v níž se náš odhad bude vyskytovat s námi danou pravděpodobností, obvykle se používá hodnota  1-α, kde α je hladina významnosti, malé číslo, zpravidla 0,05. Tato daná pravděpodobnost tedy bude 95%. Interval spolehlivosti je oblast, v níž se náš odhad bude vyskytovat s námi danou pravděpodobností, obvykle se používá hodnota  1-α, kde α je hladina významnosti, malé číslo, zpravidla 0,05. Tato daná pravděpodobnost tedy bude 95%.