talk:manual:nahodne_vzorky - Příručka ČNK

V oddílu Normální rozdělení je ve výpočtu odhadu horní a dolní meze intervalu spolehlivosti použito $p$ (relativní četnost vlastnosti v populaci), jehož hodnotu ale neznáme, naopak se snažíme odhadnout interval, v němž pravděpodobně leží. Jak ji tedy můžeme dosadit do vzorce? Nebo tomu celému špatně rozumím? — David Lukeš

Vloudila se nám do popisu chyba, ve vzorci má být jenom p', tj. relativní četnost naměřená, nikoli p. Děkuju za upozornění, opravím. — Václav Cvrček

A dále: chápu správně, že při odhadu podle normálního a binomického rozdělení nezáleží na tom, jaké byly četnosti v jednotlivých vzorcích (ať už vyberu tři vzorky o 40 výskytech nebo čtyři vzorky o 30, $p$ se spočítá z celkového počtu výskytů s danou vlastností ku 120)? Pak se ale úplně zahodí informace získaná opakovaným samplováním a dostanu stejný výsledek, ať už mám 10 vzorků s relativní četností 50 % (kde by interval spolehlivosti měl být velmi úzký) nebo 5 a 5 vzorků s četností 100 %, resp. 0 % (kde by měl interval spolehlivosti reflektovat, že mi tam ty hodnoty nějak podezřele lítaj; samozřejmě je to extrémně nepravděpodobný případ, ale pro představu problému, který mám na mysli, snad dává smysl). Taky jsem dost možná úplně mimo, ale radši se zeptám :) — David Lukeš

Ano, je to tak. Smysl vícera vzorku se v těchto případech ztrácí. Nicméně pro orientaci je i tak vhodné to rozdělit - když si člověk vizualizuje, jak ty hodnoty variují, může ho to nasměrovat k úvaze o přidání dalších vzorku (tj. zvětšení ručně procházených dat). — Václav Cvrček

Historie: • nahodne_vzorky

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence