Obě strany předchozí revizePředchozí verze | |
pojmy:chi2 [2013/08/21 18:05] – alzbetavitkova | pojmy:chi2 [2013/09/12 17:21] (aktuální) – Schvaleno pro 1. verzi vaclavcvrcek |
---|
Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:asociacni_miry#log_likelihood|log-likelihood]] nebo Fischerova exaktního testu. | Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:asociacni_miry#log_likelihood|log-likelihood]] nebo Fischerova exaktního testu. |
| |
χ2 test přitom neslouží k určení míry odlišnosti (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců), vycházejí testy téměř vždy jako statisticky významný, ačkoli relativní rozdíl mezi hodnotami není lingvisticky relevantní, uchopitelný nebo interpretovatelný. | χ2 test přitom neslouží k určení míry odlišnosti, relevance (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců), vycházejí testy téměř vždy jako statisticky signifikantní, ačkoli relativní rozdíl mezi hodnotami není lingvisticky relevantní, uchopitelný nebo interpretovatelný. |
| |
===== χ2 test při identifikaci kolokací ===== | ===== χ2 test při identifikaci kolokací ===== |
| |
Principiálně se užití χ2 testu pro identifikaci [[pojmy:kolokace|kolokací]] neliší od využití předchozího. Stejným vzorcem se v tomto případě nepoměřují dva různé texty/korpusy, ale frekvence kolokátů v okolí hledaného [[pojmy:kwic|KWICu]] s frekvencí těchto slov v celém korpusu. Je-li relativní frekvence v okolí hledaného slova (node word) výrazně větší než v celém korpusu, pak je takové slovo označeno jako kolokát. | Principiálně se užití χ2 testu pro identifikaci [[pojmy:kolokace|kolokací]] neliší od využití předchozího. Stejným vzorcem se v tomto případě nepoměřují dva různé texty/korpusy, ale frekvence kolokátů v okolí hledaného [[pojmy:kwic|KWICu]] s frekvencí těchto slov v celém korpusu. Je-li relativní frekvence v okolí hledaného slova (node word) signifikantně větší než v celém korpusu, pak je takové slovo označeno jako kolokát. |
| |
===== Související odkazy ===== | ===== Související odkazy ===== |
| |
<WRAP round box 49%> | <WRAP round box 49%> |
[[wp>Pearson's_chi-squared_test|Pearson's chi-squared test]] • [[pojmy:asociacni_miry|Asociační míry]] • [[pojmy:kolokace|Kolokace]] | [[wp>Pearson's_chi-squared_test|Pearson's chi-squared test]] • [[pojmy:asociacni_miry|Asociační míry]] • [[pojmy:kolokace|Kolokace]] |
</WRAP> | </WRAP> |