Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
pojmy:chi2 [2013/06/18 18:16] – vaclavcvrcek | pojmy:chi2 [2013/09/12 17:21] (aktuální) – Schvaleno pro 1. verzi vaclavcvrcek | ||
---|---|---|---|
Řádek 2: | Řádek 2: | ||
Test, který se užívá k určení statistické významnosti kvantitativního rozdílu v datech. V rámci korpusové lingvistiky se využívá v [[pojmy: | Test, který se užívá k určení statistické významnosti kvantitativního rozdílu v datech. V rámci korpusové lingvistiky se využívá v [[pojmy: | ||
+ | |||
+ | ===== χ2 test při analýze klíčových slov ===== | ||
Principem χ2 testu je porovnání frekvence jednotky naměřené v jednom korpusu (observed) s hodnotou očekávanou na základě pravděpodobnosti zjištěné v druhém korpusu (expected). Pokud je rozdíl těchto hodnot velký, je značná pravděpodobnost, | Principem χ2 testu je porovnání frekvence jednotky naměřené v jednom korpusu (observed) s hodnotou očekávanou na základě pravděpodobnosti zjištěné v druhém korpusu (expected). Pokud je rozdíl těchto hodnot velký, je značná pravděpodobnost, | ||
- | Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:log-likelihood|log-likelihood]] nebo Fischerova exaktního testu. | + | Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:asociacni_miry# |
+ | |||
+ | χ2 test přitom neslouží k určení míry odlišnosti, | ||
+ | |||
+ | ===== χ2 test při identifikaci kolokací ===== | ||
+ | |||
+ | Principiálně se užití χ2 testu pro identifikaci [[pojmy: | ||
+ | |||
+ | ===== Související odkazy ===== | ||
- | χ2 test přitom neslouží k určení míry odlišnosti (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců), | + | <WRAP round box 49%> |
+ | [[wp> | ||
+ | </ |