Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
kurz:vytvareni_vzorku [2016/08/09 21:15] – [Princip náhodnosti a replikovatelnosti] vaclavcvrcek | kurz:vytvareni_vzorku [2018/08/08 14:05] (aktuální) – [Postup 1 – Promíchání konkordance] vaclavcvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Vytváření náhodných vzorků ====== | ====== Vytváření náhodných vzorků ====== | ||
- | //Tato stránka se věnuje praktickým radám, jak vytvářet náhodné vzorky v aplikaci [[manualy: | + | //Tato stránka se věnuje praktickým radám, jak vytvářet náhodné vzorky v aplikaci [[manualy: |
+ | //Statistickému vyhodnocení výsledků získaných na náhodných vzorcích se věnuje [[kurz: | ||
Při vyhodnocování konkordančních údajů nastávají občas situace, kdy je třeba přistoupit k manuální analýze jednotlivých nalezených dokladů. Pokud je výchozí [[pojmy: | Při vyhodnocování konkordančních údajů nastávají občas situace, kdy je třeba přistoupit k manuální analýze jednotlivých nalezených dokladů. Pokud je výchozí [[pojmy: | ||
- | <wrap lo> | + | <WRAP round info 70%> |
- | + | Příklad: Stojíme před výzkumným úkolem zjistit v korpusu [[cnk: | |
- | V rozhraní [[manualy: | + | </WRAP> |
+ | V rozhraní [[manualy: | ||
===== Princip náhodnosti a replikovatelnosti ===== | ===== Princip náhodnosti a replikovatelnosti ===== | ||
- | Korpusové nástroje jsou koncipovány | + | Korpusové nástroje jsou vytvořeny |
- | V případě funkce **Konkordance → Promíchat** si celý proces můžeme představit tak, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (pořadí jednotlivých řádek se mění, míra promíchanosti se však už nezvětšuje). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce | + | V případě funkce **Konkordance → Promíchat** si celý proces můžeme představit tak, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (pořadí jednotlivých řádek se mění, míra promíchanosti se však už nezvětšuje). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce |
V případě funkce **Konkordance → Vzorek** je uživatel nejprve vyzván, aby zadal velikost vzorku //N//. Ten je vytvořen na základě výchozí konkordance tak, že nejprve je konkordance promíchána a z takto promíchaného konkordančního seznamu je vybráno prvních //N// řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci. | V případě funkce **Konkordance → Vzorek** je uživatel nejprve vyzván, aby zadal velikost vzorku //N//. Ten je vytvořen na základě výchozí konkordance tak, že nejprve je konkordance promíchána a z takto promíchaného konkordančního seznamu je vybráno prvních //N// řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci. | ||
- | <WRAP round info 70%> | + | Ačkoliv obě funkce promíchávají konkordanci principiálně stejným způsobem, nejsou totožné v tom smyslu, že by dávaly identické výsledky. Můžeme si to představit tak, že každá z funkcí využívá |
- | Ačkoliv obě funkce promíchávají konkordanci principiálně stejným způsobem, nejsou totožné v tom smyslu, že by dávaly identické výsledky. Můžeme si to představit tak, že každá z funkcí využívá jiný seznam náhodných čísel | + | |
- | </ | + | |
===== Vytváření několika náhodných vzorků ===== | ===== Vytváření několika náhodných vzorků ===== | ||
- | Pokud chceme | + | Chceme-li |
- | ==== Postup 1 -- Promíchání konkordance ==== | + | ==== Postup 1 – Promíchání konkordance ==== |
- | Pokud nám na vyhodnocení stačí prostředí | + | Pokud nám na vyhodnocení stačí prostředí KonText, můžeme vytvořit sérii náhodných vzorků tak, že aplikujeme funkci **Konkordance → Promíchat** a každá stránka konkordančního seznamu pak pro nás představuje samostatný vzorek (počet řádků na stránku |
- | <WRAP round important | + | <WRAP round important |
- | Postup, při kterém analyzujeme pouze první stránku promíchané konkordance a následně znovu aplikujeme funkci | + | Postup, při kterém analyzujeme pouze první stránku promíchané konkordance a následně znovu aplikujeme funkci |
</ | </ | ||
- | ==== Postup 2 - Vytváření vzorku ==== | + | ==== Postup 2 – Vytváření vzorku ==== |
- | Funkce **Konkordance → Vzorek** vybere z promíchané konkordance //N// prvních řádků. Pokud se spokojíme s jedním vzorkem, je to zcela postačující -- konkordanci buď analyzujeme přímo v KonTextu nebo ji můžeme [[manualy: | + | Funkce **Konkordance → Vzorek** vybere z promíchané konkordance //N// prvních řádků. Pokud se spokojíme s jedním vzorkem, je to zcela postačující -- konkordanci buď analyzujeme přímo v KonTextu, nebo ji můžeme [[manualy: |
Problém nastane, pokud potřebujeme vzorků víc. Funkce je totiž koncipována tak, aby každé vytvoření vzorku na stejném dotazu a korpusu dávalo stejný výsledek (viz výše). Pokud tedy chceme využít tuto funkci pro vytváření //a// vzorků o délce //N//, je třeba vytvořit jeden velký vzorek o rozsahu //a × N//, ten uložit a v textovém editoru pak ručně rozdělit na požadovaných //a// částí. | Problém nastane, pokud potřebujeme vzorků víc. Funkce je totiž koncipována tak, aby každé vytvoření vzorku na stejném dotazu a korpusu dávalo stejný výsledek (viz výše). Pokud tedy chceme využít tuto funkci pro vytváření //a// vzorků o délce //N//, je třeba vytvořit jeden velký vzorek o rozsahu //a × N//, ten uložit a v textovém editoru pak ručně rozdělit na požadovaných //a// částí. | ||
Řádek 43: | Řádek 42: | ||
Výsledky získané z analýz jednotlivých vzorků je potřeba statisticky vyhodnotit. Samotný průměr nemusí být dostatečný, | Výsledky získané z analýz jednotlivých vzorků je potřeba statisticky vyhodnotit. Samotný průměr nemusí být dostatečný, | ||
+ | |||
+ | --- //Václav Cvrček// |