Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
| kurz:vytvareni_vzorku [2016/08/09 21:15] – [Princip náhodnosti a replikovatelnosti] vaclavcvrcek | kurz:vytvareni_vzorku [2018/08/08 14:05] (aktuální) – [Postup 1 – Promíchání konkordance] vaclavcvrcek | ||
|---|---|---|---|
| Řádek 1: | Řádek 1: | ||
| ====== Vytváření náhodných vzorků ====== | ====== Vytváření náhodných vzorků ====== | ||
| - | //Tato stránka se věnuje praktickým radám, jak vytvářet náhodné vzorky v aplikaci [[manualy: | + | //Tato stránka se věnuje praktickým radám, jak vytvářet náhodné vzorky v aplikaci [[manualy: |
| + | //Statistickému vyhodnocení výsledků získaných na náhodných vzorcích se věnuje [[kurz: | ||
| Při vyhodnocování konkordančních údajů nastávají občas situace, kdy je třeba přistoupit k manuální analýze jednotlivých nalezených dokladů. Pokud je výchozí [[pojmy: | Při vyhodnocování konkordančních údajů nastávají občas situace, kdy je třeba přistoupit k manuální analýze jednotlivých nalezených dokladů. Pokud je výchozí [[pojmy: | ||
| - | <wrap lo> | + | <WRAP round info 70%> |
| - | + | Příklad: Stojíme před výzkumným úkolem zjistit v korpusu [[cnk: | |
| - | V rozhraní [[manualy: | + | </WRAP> |
| + | V rozhraní [[manualy: | ||
| ===== Princip náhodnosti a replikovatelnosti ===== | ===== Princip náhodnosti a replikovatelnosti ===== | ||
| - | Korpusové nástroje jsou koncipovány | + | Korpusové nástroje jsou vytvořeny |
| - | V případě funkce **Konkordance → Promíchat** si celý proces můžeme představit tak, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (pořadí jednotlivých řádek se mění, míra promíchanosti se však už nezvětšuje). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce | + | V případě funkce **Konkordance → Promíchat** si celý proces můžeme představit tak, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (pořadí jednotlivých řádek se mění, míra promíchanosti se však už nezvětšuje). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce |
| V případě funkce **Konkordance → Vzorek** je uživatel nejprve vyzván, aby zadal velikost vzorku //N//. Ten je vytvořen na základě výchozí konkordance tak, že nejprve je konkordance promíchána a z takto promíchaného konkordančního seznamu je vybráno prvních //N// řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci. | V případě funkce **Konkordance → Vzorek** je uživatel nejprve vyzván, aby zadal velikost vzorku //N//. Ten je vytvořen na základě výchozí konkordance tak, že nejprve je konkordance promíchána a z takto promíchaného konkordančního seznamu je vybráno prvních //N// řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci. | ||
| - | <WRAP round info 70%> | ||
| Ačkoliv obě funkce promíchávají konkordanci principiálně stejným způsobem, nejsou totožné v tom smyslu, že by dávaly identické výsledky. Můžeme si to představit tak, že každá z funkcí využívá k promíchávání jiný seznam náhodných čísel. | Ačkoliv obě funkce promíchávají konkordanci principiálně stejným způsobem, nejsou totožné v tom smyslu, že by dávaly identické výsledky. Můžeme si to představit tak, že každá z funkcí využívá k promíchávání jiný seznam náhodných čísel. | ||
| - | </ | ||
| ===== Vytváření několika náhodných vzorků ===== | ===== Vytváření několika náhodných vzorků ===== | ||
| - | Pokud chceme | + | Chceme-li |
| - | ==== Postup 1 -- Promíchání konkordance ==== | + | ==== Postup 1 – Promíchání konkordance ==== |
| - | Pokud nám na vyhodnocení stačí prostředí | + | Pokud nám na vyhodnocení stačí prostředí KonText, můžeme vytvořit sérii náhodných vzorků tak, že aplikujeme funkci **Konkordance → Promíchat** a každá stránka konkordančního seznamu pak pro nás představuje samostatný vzorek (počet řádků na stránku |
| - | <WRAP round important | + | <WRAP round important |
| - | Postup, při kterém analyzujeme pouze první stránku promíchané konkordance a následně znovu aplikujeme funkci | + | Postup, při kterém analyzujeme pouze první stránku promíchané konkordance a následně znovu aplikujeme funkci |
| </ | </ | ||
| - | ==== Postup 2 - Vytváření vzorku ==== | + | ==== Postup 2 – Vytváření vzorku ==== |
| - | Funkce **Konkordance → Vzorek** vybere z promíchané konkordance //N// prvních řádků. Pokud se spokojíme s jedním vzorkem, je to zcela postačující -- konkordanci buď analyzujeme přímo v KonTextu nebo ji můžeme [[manualy: | + | Funkce **Konkordance → Vzorek** vybere z promíchané konkordance //N// prvních řádků. Pokud se spokojíme s jedním vzorkem, je to zcela postačující -- konkordanci buď analyzujeme přímo v KonTextu, nebo ji můžeme [[manualy: |
| Problém nastane, pokud potřebujeme vzorků víc. Funkce je totiž koncipována tak, aby každé vytvoření vzorku na stejném dotazu a korpusu dávalo stejný výsledek (viz výše). Pokud tedy chceme využít tuto funkci pro vytváření //a// vzorků o délce //N//, je třeba vytvořit jeden velký vzorek o rozsahu //a × N//, ten uložit a v textovém editoru pak ručně rozdělit na požadovaných //a// částí. | Problém nastane, pokud potřebujeme vzorků víc. Funkce je totiž koncipována tak, aby každé vytvoření vzorku na stejném dotazu a korpusu dávalo stejný výsledek (viz výše). Pokud tedy chceme využít tuto funkci pro vytváření //a// vzorků o délce //N//, je třeba vytvořit jeden velký vzorek o rozsahu //a × N//, ten uložit a v textovém editoru pak ručně rozdělit na požadovaných //a// částí. | ||
| Řádek 42: | Řádek 42: | ||
| Výsledky získané z analýz jednotlivých vzorků je potřeba statisticky vyhodnotit. Samotný průměr nemusí být dostatečný, | Výsledky získané z analýz jednotlivých vzorků je potřeba statisticky vyhodnotit. Samotný průměr nemusí být dostatečný, | ||
| + | |||
| + | --- //Václav Cvrček// | ||