AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
kurz:vytvareni_vzorku [2016/08/09 21:06] – [Vytváření náhodných vzorků] vaclavcvrcekkurz:vytvareni_vzorku [2016/08/09 21:20] vaclavcvrcek
Řádek 11: Řádek 11:
 ===== Princip náhodnosti a replikovatelnosti ===== ===== Princip náhodnosti a replikovatelnosti =====
  
-Korpusové nástroje jsou koncipovány tak, aby při opakování stejných kroků na stejném výchozím materiálu (korpusu či subkorpusu) poskytovaly totožné výsledky. Aby tedy byla zachována možnost opakovat jakýkoli korpusový výzkum, je jakékoli promíchání pořadí konkordančních řádek replikovatelné se stejným výsledkem. +Korpusové nástroje jsou koncipovány tak, aby při opakování stejných kroků na stejném výchozím materiálu (korpusu či subkorpusu) poskytovaly totožné výsledky. Aby tedy byla zachována možnost opakovat jakýkoli korpusový výzkum, je jakékoli promíchání pořadí konkordančních řádek replikovatelné se stejným výsledkem. 
  
-V případě funkce **Konkordance → Promíchat** to tedy znamená, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (míra promíchanosti se však už nijak nemě). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce promíchat) měli bychom dospět vždy ke stejným výsledkům.+V případě funkce **Konkordance → Promíchat** si celý proces můžeme představit tak, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (pořadí jednotlivých řádek se mění, míra promíchanosti se však už nezvětšuje). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce promíchat) měli bychom dospět vždy ke stejným výsledkům.
  
-V případě funkce **Konkordance → Vzorek** je uživatel vyzván, aby zadal velikost vzorku //N// a ten je vytvořen na základě výchozí konkordance, která byla promíchána a z takto promíchaného seznamu bylo vybráno //N// prvních řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci.+V případě funkce **Konkordance → Vzorek** je uživatel nejprve vyzván, aby zadal velikost vzorku //N//. Ten je vytvořen na základě výchozí konkordance takže nejprve je konkordance promíchána a z takto promíchaného konkordančního seznamu je vybráno prvních //N// řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci.  
 + 
 +<WRAP round info 70%> 
 +Ačkoliv obě funkce promíchávají konkordanci principiálně stejným způsobem, nejsou totožné v tom smyslu, že by dávaly identické výsledky. Můžeme si to představit tak, že každá z funkcí využívá k promíchávání jiný seznam náhodných čísel. 
 +</WRAP>
  
 ===== Vytváření několika náhodných vzorků ===== ===== Vytváření několika náhodných vzorků =====
Řádek 21: Řádek 25:
 Pokud chceme vytvořit několik náhodných vzorků, lze doporučit dva způsoby, které se liší tím, zda k analýze budeme využívat rozhraní KonText, či zda chceme výsledky uložit a zpracovávat je v nějakém externím nástroji. Pokud chceme vytvořit několik náhodných vzorků, lze doporučit dva způsoby, které se liší tím, zda k analýze budeme využívat rozhraní KonText, či zda chceme výsledky uložit a zpracovávat je v nějakém externím nástroji.
  
-==== Postup 1 -- Promíchání konkordance ====+==== Postup 1 – Promíchání konkordance ====
  
-Pokud nám na vyhodnocení stačí prostředí aplikace KonText, můžeme vytvořit sérii náhodných vzorků tak, že aplikujeme funkci **Konkordance → Promíchat** a každá stránka konkordančního seznamu pak pro nás představuje samostatný vzorek (jeho velikost lze nastavit v menu [[manualy:kontext:moznosti_zobrazeni#obecne_volby_zobrazeni_konkordance|Zobrazeni → Obecné volby zobrazení]] získáme tak vzorky o požadované velikosti).+Pokud nám na vyhodnocení stačí prostředí aplikace KonText, můžeme vytvořit sérii náhodných vzorků tak, že aplikujeme funkci **Konkordance → Promíchat** a každá stránka konkordančního seznamu pak pro nás představuje samostatný vzorek (počet řádků na stránku lze nastavit v menu [[manualy:kontext:moznosti_zobrazeni#obecne_volby_zobrazeni_konkordance|Zobrazeni → Obecné volby zobrazení]], čímž získáme vzorky o požadovaném rozsahu).
  
 <WRAP round important 70%> <WRAP round important 70%>
-Postup, při kterém analyzujeme pouze první stránku promíchané konkordance a následně znovu aplikujeme funkci promíchat není doporučeníhodný. Problém může spočívat v tom, že při tomto postupu není zaručeno, aby ve dvou po sobě následujících promícháních nebyly na první stránce konkordančního seznamu některé řádky stejné.+Postup, při kterém analyzujeme pouze první stránku promíchané konkordance a následně znovu aplikujeme funkci promíchatnení doporučeníhodný. Problém může spočívat v tom, že při tomto postupu není zaručeno, aby ve dvou po sobě následujících promícháních nebyly na první stránce konkordančního seznamu některé řádky stejné. Nebezpečí průniku mezi takto vytvořenými vzorky se zvětšuje, pokud je výchozí konkordance relativně málo rozsáhlá.
 </WRAP> </WRAP>
  
-==== Postup 2 Vytváření vzorku ====+==== Postup 2 – Vytváření vzorku ====
  
 Funkce **Konkordance → Vzorek** vybere z promíchané konkordance //N// prvních řádků. Pokud se spokojíme s jedním vzorkem, je to zcela postačující -- konkordanci buď analyzujeme přímo v KonTextu nebo ji můžeme [[manualy:kontext:ulozit|uložit]] a pracovat s ní jiném nástroji. Funkce **Konkordance → Vzorek** vybere z promíchané konkordance //N// prvních řádků. Pokud se spokojíme s jedním vzorkem, je to zcela postačující -- konkordanci buď analyzujeme přímo v KonTextu nebo ji můžeme [[manualy:kontext:ulozit|uložit]] a pracovat s ní jiném nástroji.
Řádek 38: Řádek 42:
  
 Výsledky získané z analýz jednotlivých vzorků je potřeba statisticky vyhodnotit. Samotný průměr nemusí být dostatečný, zejména pokud je rozptyl hodnot mezi vzorky značný. Této problematice se věnuje [[kurz:nahodne_vzorky|specializovaný článek]]. Výsledky získané z analýz jednotlivých vzorků je potřeba statisticky vyhodnotit. Samotný průměr nemusí být dostatečný, zejména pokud je rozptyl hodnot mezi vzorky značný. Této problematice se věnuje [[kurz:nahodne_vzorky|specializovaný článek]].
 +
 + --- //Václav Cvrček//