Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
pojmy:chi2 [2013/08/21 18:05]
alzbetavitkova
pojmy:chi2 [2013/09/12 17:21] (aktuální)
Václav Cvrček Schvaleno pro 1. verzi
Řádek 9: Řádek 9:
 Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:​asociacni_miry#​log_likelihood|log-likelihood]] nebo Fischerova exaktního testu. ​ Test χ2 se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů [[pojmy:​asociacni_miry#​log_likelihood|log-likelihood]] nebo Fischerova exaktního testu. ​
  
-χ2 test přitom neslouží k určení míry odlišnosti (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců),​ vycházejí testy téměř vždy jako statisticky ​významný, ačkoli relativní rozdíl mezi hodnotami není lingvisticky relevantní,​ uchopitelný nebo interpretovatelný.+χ2 test přitom neslouží k určení míry odlišnosti, relevance ​(effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců),​ vycházejí testy téměř vždy jako statisticky ​signifikantní, ačkoli relativní rozdíl mezi hodnotami není lingvisticky relevantní,​ uchopitelný nebo interpretovatelný.
  
 ===== χ2 test při identifikaci kolokací ===== ===== χ2 test při identifikaci kolokací =====
  
-Principiálně se užití χ2 testu pro identifikaci [[pojmy:​kolokace|kolokací]] neliší od využití předchozího. Stejným vzorcem se v tomto případě nepoměřují dva různé texty/​korpusy,​ ale frekvence kolokátů v okolí hledaného [[pojmy:​kwic|KWICu]] s frekvencí těchto slov v celém korpusu. Je-li relativní frekvence v okolí hledaného slova (node word) výrazně větší než v celém korpusu, pak je takové slovo označeno jako kolokát.+Principiálně se užití χ2 testu pro identifikaci [[pojmy:​kolokace|kolokací]] neliší od využití předchozího. Stejným vzorcem se v tomto případě nepoměřují dva různé texty/​korpusy,​ ale frekvence kolokátů v okolí hledaného [[pojmy:​kwic|KWICu]] s frekvencí těchto slov v celém korpusu. Je-li relativní frekvence v okolí hledaného slova (node word) signifikantně větší než v celém korpusu, pak je takové slovo označeno jako kolokát.
  
 ===== Související odkazy ===== ===== Související odkazy =====
 +
 <WRAP round box 49%> <WRAP round box 49%>
 [[wp>​Pearson'​s_chi-squared_test|Pearson'​s chi-squared test]] • [[pojmy:​asociacni_miry|Asociační míry]] • [[pojmy:​kolokace|Kolokace]] [[wp>​Pearson'​s_chi-squared_test|Pearson'​s chi-squared test]] • [[pojmy:​asociacni_miry|Asociační míry]] • [[pojmy:​kolokace|Kolokace]]
 </​WRAP>​ </​WRAP>​