Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Následující verze | Předchozí verze | ||
kurz:vytvareni_vzorku [2016/08/09 10:42] – vytvořeno vaclavcvrcek | kurz:vytvareni_vzorku [2018/08/08 14:05] (aktuální) – [Postup 1 – Promíchání konkordance] vaclavcvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Vytváření náhodných vzorků ====== | ====== Vytváření náhodných vzorků ====== | ||
- | //Tato stránka se věnuje praktickým radám, jak vytvářet náhodné vzorky v aplikaci [[manualy: | + | //Tato stránka se věnuje praktickým radám, jak vytvářet náhodné vzorky v aplikaci [[manualy: |
+ | //Statistickému vyhodnocení výsledků získaných na náhodných vzorcích se věnuje [[kurz: | ||
+ | |||
+ | Při vyhodnocování konkordančních údajů nastávají občas situace, kdy je třeba přistoupit k manuální analýze jednotlivých nalezených dokladů. Pokud je výchozí [[pojmy: | ||
+ | |||
+ | <WRAP round info 70%> | ||
+ | Příklad: Stojíme před výzkumným úkolem zjistit v korpusu [[cnk: | ||
+ | </ | ||
+ | |||
+ | V rozhraní [[manualy: | ||
+ | ===== Princip náhodnosti a replikovatelnosti ===== | ||
+ | |||
+ | Korpusové nástroje jsou vytvořeny tak, aby při opakování stejných kroků na stejném výchozím materiálu (korpusu či subkorpusu) poskytovaly totožné výsledky. Aby tedy byla zachována možnost opakovat jakýkoli korpusový výzkum, je i jakékoli promíchání pořadí konkordančních řádek replikovatelné se stejným výsledkem. | ||
+ | |||
+ | V případě funkce **Konkordance → Promíchat** si celý proces můžeme představit tak, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (pořadí jednotlivých řádek se mění, míra promíchanosti se však už nezvětšuje). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce Promíchat), | ||
+ | |||
+ | V případě funkce **Konkordance → Vzorek** je uživatel nejprve vyzván, aby zadal velikost vzorku //N//. Ten je vytvořen na základě výchozí konkordance tak, že nejprve je konkordance promíchána a z takto promíchaného konkordančního seznamu je vybráno prvních //N// řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci. | ||
+ | |||
+ | Ačkoliv obě funkce promíchávají konkordanci principiálně stejným způsobem, nejsou totožné v tom smyslu, že by dávaly identické výsledky. Můžeme si to představit tak, že každá z funkcí využívá k promíchávání jiný seznam náhodných čísel. | ||
+ | |||
+ | ===== Vytváření několika náhodných vzorků ===== | ||
+ | |||
+ | Chceme-li vytvořit několik náhodných vzorků, lze doporučit dva způsoby, které se liší tím, zda k analýze budeme využívat rozhraní KonText, či zda chceme výsledky uložit a zpracovávat je v nějakém externím nástroji. | ||
+ | |||
+ | ==== Postup 1 – Promíchání konkordance ==== | ||
+ | |||
+ | Pokud nám na vyhodnocení stačí prostředí KonText, můžeme vytvořit sérii náhodných vzorků tak, že aplikujeme funkci **Konkordance → Promíchat** a každá stránka konkordančního seznamu pak pro nás představuje samostatný vzorek (počet řádků na stránku lze nastavit v menu [[manualy: | ||
+ | |||
+ | <WRAP round important 60%> | ||
+ | Postup, při kterém analyzujeme pouze první stránku promíchané konkordance a následně znovu aplikujeme funkci **Promíchat**, | ||
+ | </ | ||
+ | |||
+ | ==== Postup 2 – Vytváření vzorku ==== | ||
+ | |||
+ | Funkce **Konkordance → Vzorek** vybere z promíchané konkordance //N// prvních řádků. Pokud se spokojíme s jedním vzorkem, je to zcela postačující -- konkordanci buď analyzujeme přímo v KonTextu, nebo ji můžeme [[manualy: | ||
+ | |||
+ | Problém nastane, pokud potřebujeme vzorků víc. Funkce je totiž koncipována tak, aby každé vytvoření vzorku na stejném dotazu a korpusu dávalo stejný výsledek (viz výše). Pokud tedy chceme využít tuto funkci pro vytváření //a// vzorků o délce //N//, je třeba vytvořit jeden velký vzorek o rozsahu //a × N//, ten uložit a v textovém editoru pak ručně rozdělit na požadovaných //a// částí. | ||
+ | |||
+ | ===== Vyhodnocení ===== | ||
+ | |||
+ | Výsledky získané z analýz jednotlivých vzorků je potřeba statisticky vyhodnotit. Samotný průměr nemusí být dostatečný, | ||
+ | |||
+ | --- //Václav Cvrček// |