Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
| pojmy:chi2 [2013/06/18 18:16] – vaclavcvrcek | pojmy:chi2 [2013/09/12 17:21] (aktuální) – Schvaleno pro 1. verzi vaclavcvrcek | ||
|---|---|---|---|
| Řádek 2: | Řádek 2: | ||
| Test, který se užívá k určení statistické významnosti kvantitativního rozdílu v datech. V rámci korpusové lingvistiky se využívá v [[pojmy: | Test, který se užívá k určení statistické významnosti kvantitativního rozdílu v datech. V rámci korpusové lingvistiky se využívá v [[pojmy: | ||
| + | |||
| + | ===== χ2 test při analýze klíčových slov ===== | ||
| Principem χ2 testu je porovnání frekvence jednotky naměřené v jednom korpusu (observed) s hodnotou očekávanou na základě pravděpodobnosti zjištěné v druhém korpusu (expected). Pokud je rozdíl těchto hodnot velký, je značná pravděpodobnost, | Principem χ2 testu je porovnání frekvence jednotky naměřené v jednom korpusu (observed) s hodnotou očekávanou na základě pravděpodobnosti zjištěné v druhém korpusu (expected). Pokud je rozdíl těchto hodnot velký, je značná pravděpodobnost, | ||
| - | Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:log-likelihood|log-likelihood]] nebo Fischerova exaktního testu. | + | Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:asociacni_miry# |
| + | |||
| + | χ2 test přitom neslouží k určení míry odlišnosti, | ||
| + | |||
| + | ===== χ2 test při identifikaci kolokací ===== | ||
| + | |||
| + | Principiálně se užití χ2 testu pro identifikaci [[pojmy: | ||
| + | |||
| + | ===== Související odkazy ===== | ||
| - | χ2 test přitom neslouží k určení míry odlišnosti (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců), | + | <WRAP round box 49%> |
| + | [[wp> | ||
| + | </ | ||