Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
manualy:kontext:konkordance [2018/08/03 15:33]
Michal Škrabal [Práce s konkordancí]
manualy:kontext:konkordance [2018/12/13 12:23] (aktuální)
Jan Kocek
Řádek 1: Řádek 1:
 ====== Menu: Konkordance ====== ====== Menu: Konkordance ======
  
-[{{:​manualy:​kontext:​konkordance-liska.png?​direct&​500 |Konkordanční seznam ​FIXME}}]+[{{:​manualy:​kontext:​konkordance-liska.png?​direct&​500 |Konkordanční seznam }}]
  
 Základním typem vyhodnocení dotazu je [[pojmy:​konkordance|konkordance]],​ resp. konkordanční seznam. Jedná se o výpis všech slov nebo frází, které odpovídají dotazu ([[pojmy:​kwic|KWIC]]),​ spolu s jejich pravým a levým kontextem, příp. i údajem o zdrojovém textu. Dlouhý konkordanční seznam je většinou rozdělen na několik stránek, mezi kterými je možné přecházet pomocí šipek umístěných v záhlaví a zápatí konkordančního seznamu. ​ Základním typem vyhodnocení dotazu je [[pojmy:​konkordance|konkordance]],​ resp. konkordanční seznam. Jedná se o výpis všech slov nebo frází, které odpovídají dotazu ([[pojmy:​kwic|KWIC]]),​ spolu s jejich pravým a levým kontextem, příp. i údajem o zdrojovém textu. Dlouhý konkordanční seznam je většinou rozdělen na několik stránek, mezi kterými je možné přecházet pomocí šipek umístěných v záhlaví a zápatí konkordančního seznamu. ​
Řádek 17: Řádek 17:
 [{{ :​kurz:​dialog_p.png?​nolink&​500|Rozšíření kontextu v mluvených korpusech a jeho zobrazení podle promluv}}] [{{ :​kurz:​dialog_p.png?​nolink&​500|Rozšíření kontextu v mluvených korpusech a jeho zobrazení podle promluv}}]
  
-Textové okolí klíčového slova je možné rozšířit buď pro všechny konkordanční řádky (viz menu [[manualy:​kontext:​moznosti_zobrazeni#obecne_volby_zobrazeni_konkordance|Zobrazení → Obecné volby zobrazení ​konkordance]]), nebo je možné detailně prohlížet **širší kontext** pouze jedné z nich ve speciálním okně, které se objeví při kliknutí na KWIC (označený konkordanční řádek se přitom pro snazší orientaci podbarví modře). Zde je možné (v omezeném rozsahu) kontext rozšiřovat pomocí modrých šipek na začátku a na konci ukázky. ​+Textové okolí klíčového slova je možné rozšířit buď pro všechny konkordanční řádky (viz menu [[manualy:​kontext:​zobrazeni#obecne_volby_zobrazeni|Zobrazení → Obecné volby zobrazení]]),​ nebo je možné detailně prohlížet **širší kontext** pouze jedné z nich ve speciálním okně, které se objeví při kliknutí na KWIC (označený konkordanční řádek se přitom pro snazší orientaci podbarví modře). Zde je možné (v omezeném rozsahu) kontext rozšiřovat pomocí modrých šipek na začátku a na konci ukázky. ​
  
-Podrobnější **informace o textu**, z něhož konkrétní konkordanční řádek pochází, se zobrazí po kliknutí na metainformace ​uvedené barevně ​vlevo u každého řádku. Takto vyvolaná detailní metainformace se objeví v okně v dolní části konkordančního seznamu, ​v němž ​jsou všechny údaje o daném textu a strukturách,​ v nichž se KWIC nachází (viz [[seznamy:​index|seznamy použitých zkratek]]).+Podrobnější **informace o textu**, z něhož konkrétní konkordanční řádek pochází, se zobrazí po kliknutí na modře zbarvené ​metainformace vlevo u každého řádku. Takto vyvolaná detailní metainformace se objeví v okně v dolní části konkordančního seznamu, ​ve kterém ​jsou všechny údaje o daném textu a strukturách,​ v nichž se KWIC nachází (viz [[seznamy:​index|seznamy použitých zkratek]]).
  
 V každém řádku je úplně vlevo rovněž k dispozici zaškrtávací políčko pro **ruční označování** jednotlivých konkordančních řádek. Toto označování je možné provádět ve dvou režimech: V každém řádku je úplně vlevo rovněž k dispozici zaškrtávací políčko pro **ruční označování** jednotlivých konkordančních řádek. Toto označování je možné provádět ve dvou režimech:
Řádek 26: Řádek 26:
   * **skupiny**:​ obecná klasifikace konkordančních řádek do skupin (např. podle významu) pomocí čísel zadaných uživatelem (řádky se následně barevně označí podle skupin)   * **skupiny**:​ obecná klasifikace konkordančních řádek do skupin (např. podle významu) pomocí čísel zadaných uživatelem (řádky se následně barevně označí podle skupin)
  
-V obou režimech se při označování řádek objeví v záhlaví konkordančního seznamu odkaz s průběžně aktualizovaným počtem vybraných řádek. Oba režimy se však liší v možnostech další práce s označenými řádky, které jsou k dispozici po kliknutí na tento odkaz: zatímco základní výběr vede pouze k odstranění,​ nebo naopak ponechání vybraných řádků v konkordanci,​ možnosti práce se skupinami jsou širší. Jako první krok však v tomto případě ​Kontext ​požaduje uložení zadané klasifikace do skupin, které je nutné pro zachování perzistence -- po uložení se totiž změní URL tak, aby zůstalo jednoznačným identifikátorem zadaného dotazu i provedené klasifikace. Poté je možné zobrazení jednoduché statistiky vybraných skupin, třídění konkordancí podle nich, nebo také návrat k další editaci klasifikace do skupin.+V obou režimech se při označování řádek objeví v záhlaví konkordančního seznamu odkaz s průběžně aktualizovaným počtem vybraných řádek. Oba režimy se však liší v možnostech další práce s označenými řádky, které jsou k dispozici po kliknutí na tento odkaz: zatímco základní výběr vede pouze k odstranění,​ nebo naopak ponechání vybraných řádků v konkordanci,​ možnosti práce se skupinami jsou širší. Jako první krok však v tomto případě ​KonText ​požaduje uložení zadané klasifikace do skupin, které je nutné pro zachování perzistence -- po uložení se totiž změní URL tak, aby zůstalo jednoznačným identifikátorem zadaného dotazu i provedené klasifikace. Poté je možné zobrazení jednoduché statistiky vybraných skupin, třídění konkordancí podle nich, nebo také návrat k další editaci klasifikace do skupin.
  
-[{{:​manualy:​kontext:​podily_skupin.png?​450 |Podíly označených skupin řádků}}]+V případě, že je korpus [[pojmy:​syntakticka_analyza|syntakticky označkován]] (např. [[cnk:​syn2015|SYN2015]]),​ nachází se mezi tímto zaškrtávacím políčkem a metainformací o textu ikonka {{:​manualy:​kontext:​syntax-tree-icon.png?​nolink&​20|}} sloužící k vyvolání syntaktického grafu.  
 + 
 +[{{:​manualy:​kontext:​podily_skupin.png?​450 |Podíly označených skupin řádků }}]
  
 ===== Třídění ===== ===== Třídění =====
  
-Jednoduchou metodou, jak se zorientovat v rozsáhlé konkordanci,​ je třídění,​ které seřadí podle abecedy konkordanci a seskupí tak analogické případy k sobě.+Jednoduchou metodou, jak se zorientovat v rozsáhlé konkordanci,​ je třídění,​ které seřadí podle abecedy konkordanci a seskupí tak analogické případy k sobě. Tuto funkci lze na obrazovce s konkordancí pohodlně vyvolat stiskem klávesy ''​S''​ anebo pomocí volby **Konkordance → Třídění**.
  
-[{{ :​manualy:​kontext:​trideni.png?​direct&​300|Formulář třídění }}]+[{{ :​manualy:​kontext:​trideni.png?​direct&​300|Formuláře jednoduchého a víceúrovňového ​třídění }}]
  
 [[manualy:​kontext:​index|Rozhraní KonText]] poskytuje několik možností abecedního setřídění konkordance. [[manualy:​kontext:​index|Rozhraní KonText]] poskytuje několik možností abecedního setřídění konkordance.
Řádek 47: Řádek 49:
 Volby **Nerozlišovat velikost** a **Zpětně** se aplikují v jednoduchém i víceúrovňovém třídění. V případě volby Nerozlišovat velikost jde o to, zda budou při třídění rozlišována velká/​malá písmena ([[pojmy:​case-sensitive|case-sensitive]]) nebo zda budou chápána jako stejný znak ([[pojmy:​case-insensitive|case-insensitive]]). Druhá volba pak umožňuje klasické abecední třídění (nezaškrtnuto) nebo třídění retrográdní,​ tj. abecední třídění podle konce slova (nikoli podle jeho začátku, jak je běžné). Volby **Nerozlišovat velikost** a **Zpětně** se aplikují v jednoduchém i víceúrovňovém třídění. V případě volby Nerozlišovat velikost jde o to, zda budou při třídění rozlišována velká/​malá písmena ([[pojmy:​case-sensitive|case-sensitive]]) nebo zda budou chápána jako stejný znak ([[pojmy:​case-insensitive|case-insensitive]]). Druhá volba pak umožňuje klasické abecední třídění (nezaškrtnuto) nebo třídění retrográdní,​ tj. abecední třídění podle konce slova (nikoli podle jeho začátku, jak je běžné).
  
-**Víceúrovňové třídění** umožňuje kombinovat všechny možné způsoby třídění do maximálně ​třístupňové hierarchie. Je tedy možné třídit konkordanci v 1. úrovni podle textového typu, konkordance se stejným textovým typem jsou pak tříděny v 2. úrovni (např. podle prvního pravého kontextového slova) a ve 3. úrovni podle klíčového slova samotného.+**Víceúrovňové třídění** umožňuje kombinovat všechny možné způsoby třídění do maximálně ​čtyřstupňové hierarchie. Je tedy možné třídit konkordanci v 1. úrovni podle textového typu, konkordance se stejným textovým typem jsou pak tříděny v 2. úrovni (např. podle prvního pravého kontextového slova) a ve 3. úrovni podle klíčového slova samotného.
  
 To, že konkordance je setříděná,​ je indikováno ve stavovém řádku konkordance (vedle údajů o její frekvenci). To, že konkordance je setříděná,​ je indikováno ve stavovém řádku konkordance (vedle údajů o její frekvenci).
Řádek 53: Řádek 55:
 ===== Promíchat ===== ===== Promíchat =====
  
-V základním nastavení jsou jednotlivé řádky [[pojmy:​konkordance|konkordance]] náhodně promíchané. To představuje výhodu zejména v situacích, kdy je konkordance rozsáhlá a potřebujeme získat její reprezentativní vzorek (např. pro manuální analýzu). Pokud bychom chtěli vytvořit další promíchání (a získat tak nový náhodný vzorek řádek), můžeme použít volbu **Konkordance → Promíchat**. Pokud bychom volbu //Promíchat// ve výchozím nastavení neměli zapnutou, konkordance by byla uspořádaná tak, že výsledky hledání (jednotlivé konkordanční řádky) bychom viděli v pořadí, v jakém je nacházíme v korpusu (např. v korpusu [[cnk:syn2010|SYN2010]] jsou nejprve umístěny texty beletristické,​ pak odborné a nakonec publicistika). ​+V základním nastavení jsou jednotlivé řádky [[pojmy:​konkordance|konkordance]] náhodně promíchané. To představuje výhodu zejména v situacích, kdy je konkordance rozsáhlá a potřebujeme získat její reprezentativní vzorek (např. pro manuální analýzu). Pokud bychom chtěli vytvořit další promíchání (a získat tak nový náhodný vzorek řádek), můžeme použít volbu **Konkordance → Promíchat**. Pokud bychom volbu **Promíchat** ve výchozím nastavení neměli zapnutou, konkordance by byla uspořádaná tak, že výsledky hledání (jednotlivé konkordanční řádky) bychom viděli v pořadí, v jakém je nacházíme v korpusu (např. v korpusu [[cnk:syn2015|SYN2015]] jsou nejprve umístěny texty beletristické,​ pak odborné a nakonec publicistika). ​
  
 Výsledkem operace je promíchání jednotlivých řádek konkordance,​ které je sice náhodné, ale zároveň opakovatelné. Pro každou konkordanci existuje jednoznačný algoritmus promíchávání,​ který způsobí, že výsledky po prvním, druhém, třetím... //n//-tém promíchání se při opakovaných pokusech na stejném dotazu shodují. To zaručuje opakovatelnost experimentů na korpusech i při použití promíchané konkordance. Výsledkem operace je promíchání jednotlivých řádek konkordance,​ které je sice náhodné, ale zároveň opakovatelné. Pro každou konkordanci existuje jednoznačný algoritmus promíchávání,​ který způsobí, že výsledky po prvním, druhém, třetím... //n//-tém promíchání se při opakovaných pokusech na stejném dotazu shodují. To zaručuje opakovatelnost experimentů na korpusech i při použití promíchané konkordance.
  
-Volbu //Promíchat// doporučujeme užívat automaticky (viz [[manualy:​kontext:​moznosti_zobrazeni|Zobrazení]]),​ což zajistí, že každá konkordance před tím, než je zobrazena, bude nejprve tímto způsobem znáhodněna. Takovýto postup funguje jako účinná prevence před vytvářením nekorektních závěrů na základě studia vzorku výsledků pocházejících z nereprezentativní sady textů.+Volbu **Promíchat** doporučujeme užívat automaticky (viz [[manualy:​kontext:​zobrazeni|Zobrazení]]),​ což zajistí, že každá konkordance před tím, než je zobrazena, bude nejprve tímto způsobem znáhodněna. Takovýto postup funguje jako účinná prevence před vytvářením nekorektních závěrů na základě studia vzorku výsledků pocházejících z nereprezentativní sady textů.
 ===== Vzorek ===== ===== Vzorek =====
  
-Alternativou k promíchání při práci zejména s rozsáhlou konkordancí je vytváření náhodných vzorků (**Konkordance → Vzorek**). Výhodou tohoto přístupu je zejména fakt, že se rozsáhlá konkordance zmenší na základě náhodného výběru na rozsah, který je lidskými silami analyzovatelný. ​Když omezíme ​rozsah konkordance tímto způsobem, ovlivní to samozřejmě absolutní frekvence výsledků. Pokud je ovšem vzorek dostatečně velký, relativní frekvence (tj. poměry mezi zkoumanými jevy) by měly zůstat zachovány. +Alternativou k promíchání při práci zejména s rozsáhlou konkordancí je vytváření náhodných vzorků (**Konkordance → Vzorek** ​resp. klávesová zkratka ''​M''​). Výhodou tohoto přístupu je zejména fakt, že se rozsáhlá konkordance zmenší na základě náhodného výběru na rozsah, který je lidskými silami analyzovatelný. ​Omezíme-li ​rozsah konkordance tímto způsobem, ovlivní to samozřejmě absolutní frekvence výsledků. Pokud je ovšem vzorek dostatečně velký, relativní frekvence (tj. poměry mezi zkoumanými jevy) by měly zůstat zachovány.
  
 +Možnostem vytváření vzorků se věnuje [[kurz:​vytvareni_vzorku|specializovaný návod]] v rámci manuálu.
 ===== Popis dotazu ===== ===== Popis dotazu =====
  
  
-[{{:​manualy:​kontext:​popis-dotazu.png?​direct&​300|Popis složitějšího dotazu}}]+[{{:​manualy:​kontext:​popis-dotazu.png?​direct&​300|Popis složitějšího dotazu }}] 
  
 +Funkce **Konkordance → Popis dotazu** zobrazí jednak kompletní zadání aktuálního dotazu (včetně zvoleného korpusu a všech podmínek), dále pak i každou další operaci, která změnila podobu nebo rozsah konkordance. Uživatel má zároveň možnost se k jednotlivým krokům a mezifázím vracet a obnovit tak podobu konkordance z kteréhokoli kroku.
  
-Funkce ​**Popis dotazu** zobrazí jednak kompletní zadání aktuálního ​dotazu (včetně zvoleného korpusu a všech podmínek)dále pak i každou další operaci, která změnila podobu nebo rozsah konkordance. Uživatel má zároveň možnost se k jednotlivým krokům a mezifázím vracet a obnovit tak podobu konkordance z kteréhokoli kroku.+Nadto umožňuje volba **Editovat** změnit parametry ​dotazu ​přímo nad vyhledanou konkordancí ​(bez nutnosti iniciovat nový dotaz). Tuto funkci oceníte zejména ​případě, že chcete původní dotaz zpřesnit či doladit.
  
-Popis dotazu tak představuje komplexnější a obecnější variantu prostého //​Undo// ​(viz níže), které je schopné vždy pouze jednoho kroku zpět. Umožňuje také přesnou specifikaci dotazu pro pozdější využití, např. ve výzkumné zprávě, vědecké práci apod.+Popis dotazu tak představuje komplexnější a obecnější variantu prostého ​**Zpět** (//Undo//), které je schopné vždy pouze jednoho kroku nazpět. Umožňuje také přesnou specifikaci dotazu pro pozdější využití, např. ve výzkumné zprávě, vědecké práci apod.
  
 ===== Archivovat dotaz ===== ===== Archivovat dotaz =====
  
-Funkce **Archivovat dotaz** umožňuje zadaný dotaz pojmenovat a trvale jej uložit do historie dotazů (zobrazí se pod volbou **Dotaz → Předchozí dotazy**). Ukládá se přitom kompletní stav formuláře,​ tedy např. i vybrané typy textů.+Funkce **Konkordance → Archivovat dotaz** umožňuje zadaný dotaz pojmenovat a trvale jej uložit do historie dotazů (zobrazí se pod volbou **Dotaz → Předchozí dotazy**). Ukládá se přitom kompletní stav formuláře,​ tedy např. i vybrané typy textů.
  
 ===== Zpět ===== ===== Zpět =====
  
-Funkce **Konkordance → Zpět** podobně jako v jiných programech vrátí zpět poslední provedenou akci (používaný je také anglický ekvivalent //Undo//). V našem případě se tato funkce omezuje pouze na operace, které ovlivňují konkordanci (tzn. filtrování,​ třídění,​ promíchávání apod.). Nevztahuje se na uživatelská nastavení a možnosti zobrazení.+Funkce **Konkordance → Zpět** podobně jako v jiných programech vrátí zpět poslední provedenou akci (používá se také anglický ekvivalent //Undo//). V našem případě se tato funkce omezuje pouze na operace, které ovlivňují konkordanci (tzn. filtrování,​ třídění,​ promíchávání apod.). Nevztahuje se na uživatelská nastavení a možnosti zobrazení.
  
  
Řádek 86: Řádek 90:
  
 <WRAP center round box 48%> <WRAP center round box 48%>
-**[[manualy:​kontext:​index|Menu]]**:​ [[manualy:​kontext:​novy_dotaz|Dotaz]] • [[manualy:​kontext:​korpusy|Korpusy]] • [[manualy:​kontext:​ulozit|Uložit]] • [[manualy:​kontext:​konkordance|Konkordance]] • [[manualy:​kontext:​filtr|Filtr]] • [[manualy:​kontext:​frekvencni_distribuce|Frekvence]] • [[[[manualy:​kontext:​kolokace|Kolokace]] • [[zobrazeni|Zobrazení]] • [[manualy:​kontext:​napoveda|Nápověda]]+**[[manualy:​kontext:​index|Menu]]**:​ [[manualy:​kontext:​novy_dotaz|Dotaz]] • [[manualy:​kontext:​korpusy|Korpusy]] • [[manualy:​kontext:​ulozit|Uložit]] • [[manualy:​kontext:​konkordance|Konkordance]] • [[manualy:​kontext:​filtr|Filtr]] • [[manualy:​kontext:​frekvence|Frekvence]] • [[[[manualy:​kontext:​kolokace|Kolokace]] • [[zobrazeni|Zobrazení]] • [[manualy:​kontext:​napoveda|Nápověda]]
 </​WRAP>​ </​WRAP>​