AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Vytváření náhodných vzorků

Tato stránka se věnuje praktickým radám, jak vytvářet náhodné vzorky v aplikaci KonText.
Statistickému vyhodnocení výsledků získaných na náhodných vzorcích se věnuje specializovaný článek.

Při vyhodnocování konkordančních údajů nastávají občas situace, kdy je třeba přistoupit k manuální analýze jednotlivých nalezených dokladů. Pokud je výchozí konkordance navíc rozsáhlá, je z praktických důvodů nezbytné provést vyhodnocení pouze na omezeném vzorku náhodně vybraných konkordancí.

Příklad: Stojíme před výzkumným úkolem zjistit v korpusu SYN2015 kolikrát je lemma kolej použito ve významu „studentská ubytovna“ a kolikrát se vyskytuje v původním významu „vodící dráha pro vlaky“. Vzhledem k tomu, že celkový počet výskytů lemmatu kolej je 4039, je ospravedlnitelné přistoupit k analýze náhodného vzorku.

Princip náhodnosti a replikovatelnosti

V rozhraní KonText jsou implementovány dvě funkce, které pracují s náhodným pořadím jednotlivých konkordančních řádek: Konkordance → Promíchat a Konkordance → Vzorek. Obě tyto funkce je možné při práci využít (viz popis níže), dříve než tak učiníme, měli bychom nejprve vyjasnit, jakým způsobem je náhodnost pořadí řádek v rozhraní KonText koncipována.

Korpusové nástroje jsou koncipovány tak, aby při opakování stejných kroků na stejném výchozím materiálu (korpusu či subkorpusu) poskytovaly totožné výsledky. Aby tedy byla zachována možnost opakovat jakýkoli korpusový výzkum, je jakékoli promíchání pořadí konkordančních řádek replikovatelné se stejným výsledkem.

V případě funkce Konkordance → Promíchat to tedy znamená, že výchozí pořadí řádků v konkordanci bude změněno podle seznamu náhodných čísel. Promíchaná konkordance může být dále znovu a znovu znáhodňována podle stejného principu (míra promíchanosti se však už nijak nemění). Pokud se pokusíme tentýž postup zopakovat (stejný korpus, stejný dotaz a stejný počet aplikací funkce promíchat) měli bychom dospět vždy ke stejným výsledkům.

V případě funkce Konkordance → Vzorek je uživatel vyzván, aby zadal velikost vzorku N a ten je vytvořen na základě výchozí konkordance, která byla promíchána a z takto promíchaného seznamu bylo vybráno N prvních řádků. Jedná se tak principiálně o totožnou operaci jako v případě funkce Konkordance → Promíchat s tou výjimkou, že po znáhodnění konkordance dochází ještě k její redukci.

Vytváření několika náhodných vzorků