Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
manualy:kontext:konkordance [2023/04/01 02:34] – [Promíchat] jankrivan | manualy:kontext:konkordance [2024/11/05 11:49] (aktuální) – [Promíchat] michalskrabal |
---|
\\ | \\ |
\\ | \\ |
Text odkazu v položce **Dotaz** vždy zjednodušeně zobrazuje uživatelem zadaný dotaz, za ním je v závorce uveden počet výskytů. Dotaz lze pomocí odkazu zobrazit (včetně zvoleného korpusu a všech podmínek) i editovat, tj. změnit jeho parametry přímo nad vyhledanou konkordancí (bez nutnosti iniciovat nový dotaz). Tuto funkci oceníte zejména v případě, že chcete původní dotaz zpřesnit či doladit. Při editaci dotazu se zároveň musíte rozhodnout, zda se mají vykonat i následující operace nad konkordancí. Jejich součástí je i užitečná operace promíchání (lze ji jednorázově spustit z menu **Konkordance → Promíchání** nebo nastavit jako základní v menu **Zobrazení → Obecné volby zobrazení**, podrobněji viz oddíl níže), proto je obvykle vhodné ponechat volbu **Automaticky provést i následující operace** zaškrtnutou. | Text odkazu v položce **Dotaz** vždy zjednodušeně zobrazuje uživatelem zadaný dotaz, za ním je v závorce uveden počet výskytů. Dotaz lze pomocí odkazu zobrazit i editovat, tj. změnit jeho parametry přímo nad vyhledanou konkordancí (bez nutnosti iniciovat nový dotaz). Tuto funkci oceníte zejména v případě, že chcete původní dotaz zpřesnit či doladit. Při editaci dotazu se zároveň musíte rozhodnout, zda se mají vykonat i následující operace nad konkordancí. Jejich součástí je i užitečná operace promíchání (lze ji nastavit přímo ve vyhledávácím formuláři, případně spustit posléze z menu **Konkordance → Promíchání**), proto je obvykle vhodné ponechat volbu **Automaticky provést i následující operace** zaškrtnutou. |
| |
Následující položky na řádku pak zastupují jednotlivé kroky v posloupnosti úprav, které mění podobu a rozsah konkordance. S nimi je možné pracovat analogicky jako s úvodním dotazem. | Následující položky na řádku pak zastupují jednotlivé kroky v posloupnosti úprav, které mění podobu a rozsah konkordance. S nimi je možné pracovat analogicky jako s úvodním dotazem. |
| |
===== Práce s konkordancí ===== | ===== Práce s konkordancí ===== |
| |
| ==== Základní představení ==== |
| |
Konkordanční seznam je rozdělen na několik částí. Uprostřed je barevně zvýrazněn [[pojmy:kwic|KWIC]], jenž je obklopen pravým a levým kontextem. V levém sloupci je u každého řádku uvedena stručná informace o zdrojovém textu (její podoba závisí na nastavení v menu [[manualy:kontext:moznosti_zobrazeni|Zobrazení]]). V záhlaví konkordance se nacházejí základní informace, jako je absolutní [[pojmy:frekvence|frekvence]], relativní frekvence ([[pojmy:ipm|i.p.m.]]), [[pojmy:arf|ARF]] a status konkordance (zda je [[manualy:kontext:konkordance#trideni|setříděna]], nebo [[manualy:kontext:konkordance#promichat|promíchána]]). Zcela vpravo jsou umístěny šipky pro prohlížení jednotlivých stránek konkordance. | Konkordanční seznam je rozdělen na několik částí. Uprostřed je barevně zvýrazněn [[pojmy:kwic|KWIC]], jenž je obklopen pravým a levým kontextem. V levém sloupci je u každého řádku uvedena stručná informace o zdrojovém textu (její podoba závisí na nastavení v menu [[manualy:kontext:moznosti_zobrazeni|Zobrazení]]). V záhlaví konkordance se nacházejí základní informace, jako je absolutní [[pojmy:frekvence|frekvence]], relativní frekvence ([[pojmy:ipm|i.p.m.]]), [[pojmy:arf|ARF]] a status konkordance (zda je [[manualy:kontext:konkordance#trideni|setříděna]], nebo [[manualy:kontext:konkordance#promichat|promíchána]]). Zcela vpravo jsou umístěny šipky pro prohlížení jednotlivých stránek konkordance. |
| |
| ==== Další informace o textu ==== |
| |
| Podrobnější **informace o textu**, z něhož konkrétní konkordanční řádek pochází, se zobrazí po kliknutí na modře zbarvené metainformace vlevo u každého řádku. Takto vyvolaná detailní metainformace se objeví v okně v dolní části konkordančního seznamu, ve kterém jsou všechny údaje o daném textu a strukturách, v nichž se KWIC nachází (viz [[seznamy:index|seznamy použitých zkratek]]). |
| |
[{{:kurz:konkordance_kdyz_skoleni_skoncilo_rozsirenikontextu.png?direct&700|Konkordance s rozšířeným kontextem}}] | [{{:kurz:konkordance_kdyz_skoleni_skoncilo_rozsirenikontextu.png?direct&700|Konkordance s rozšířeným kontextem}}] |
\\ | \\ |
Podrobnější **informace o textu**, z něhož konkrétní konkordanční řádek pochází, se zobrazí po kliknutí na modře zbarvené metainformace vlevo u každého řádku. Takto vyvolaná detailní metainformace se objeví v okně v dolní části konkordančního seznamu, ve kterém jsou všechny údaje o daném textu a strukturách, v nichž se KWIC nachází (viz [[seznamy:index|seznamy použitých zkratek]]). | |
| |
Textové okolí klíčového slova je možné rozšířit buď pro všechny konkordanční řádky (viz menu [[manualy:kontext:zobrazeni#obecne_volby_zobrazeni|Zobrazení → Obecné volby zobrazení]]), nebo je možné detailně prohlížet **širší kontext** pouze jedné z nich ve speciálním okně, které se objeví při kliknutí na KWIC (označený konkordanční řádek se přitom pro snazší orientaci podbarví modře). Zde je možné (v omezeném rozsahu) kontext rozšiřovat pomocí modrých šipek na začátku a na konci ukázky. | ==== Zobrazení textového okolí KWIC ==== |
| |
V každém řádku je úplně vlevo rovněž k dispozici zaškrtávací políčko pro **ruční označování** jednotlivých konkordančních řádek (viz níže). V případě, že je korpus [[pojmy:syntakticka_analyza|syntakticky označkován]] (např. [[cnk:syn2015|SYN2015]]), nachází se mezi tímto zaškrtávacím políčkem a metainformací o textu ikonka {{:manualy:kontext:syntax-tree-icon.png?nolink&20|}} sloužící k vyvolání **syntaktického grafu**. | Textové okolí klíčového slova je možné rozšířit buď pro všechny konkordanční řádky (viz menu [[manualy:kontext:zobrazeni#obecne_volby_zobrazeni|Zobrazení → Obecné volby zobrazení]], volba //Velikost KWIC kontextu (počet pozic)//), nebo je možné detailně prohlížet **širší kontext** pouze jedné z nich ve speciálním okně, které se objeví při kliknutí na KWIC (označený konkordanční řádek se přitom pro snazší orientaci podbarví modře). Zde je možné (v omezeném rozsahu) kontext rozšiřovat pomocí modrých šipek na začátku a na konci ukázky. |
| |
| V **novějších psaných korpusech** (počínaje [[cnk:syn2020|SYN2020]] a [[cnk:syn:verze9|SYN verze9]]) lze přepnout mezi dvěma možnostmi zobrazení okna: základní zobrazení textového okolí odpovídající [[pojmy:token|tokenizaci]] daného korpusu, nebo zobrazení formátovaného textu zachovávající tokenizaci a do určité míry i typografickou podobu zdrojového textu (toho lze například využít pro přehlednější zobrazení poezie). |
| |
[{{:kurz:dialog_p.png?nolink&direct&450 |Rozšíření kontextu v mluvených korpusech a jeho zobrazení podle promluv}}] | [{{:kurz:dialog_p.png?nolink&direct&450 |Rozšíření kontextu v mluvených korpusech a jeho zobrazení podle promluv}}] |
V **mluvených korpusech** je možné přepnout mezi dvěma možnostmi zobrazení okna se širším kontextem: lineární zobrazení kontextu (stejně jako v psaných korpusech), nebo zobrazení podle promluv jednotlivých mluvčích. Zobrazení dialogu podle promluv jednotlivých mluvčích usnadňuje orientaci v transkriptech mluveného jazyka. | V **mluvených korpusech** je rovněž možné přepnout mezi dvěma možnostmi zobrazení: lineární zobrazení (stejně jako v psaných korpusech), nebo zobrazení podle promluv jednotlivých mluvčích. Zobrazení dialogu podle promluv jednotlivých mluvčích usnadňuje orientaci v transkriptech mluveného jazyka. |
| |
==== Ruční označování řádek === | ==== Ruční označování řádek === |
| |
| V každém řádku je úplně vlevo také k dispozici zaškrtávací políčko pro **ruční označování** jednotlivých konkordančních řádek. |
| |
[{{ :manualy:kontext:podily_skupin.png?direct&450|Podíly označených skupin řádků}}] | [{{ :manualy:kontext:podily_skupin.png?direct&450|Podíly označených skupin řádků}}] |
Označování řádek pomocí zaškrtávacího tlačítka je možné provádět ve dvou režimech: | Označování řádek je možné provádět ve dvou režimech: |
| |
* **základní**: výběr konkrétních konkordančních řádek s možností každou z nich pouze vybrat či nikoliv | * **základní**: výběr konkrétních konkordančních řádek s možností každou z nich pouze vybrat či nikoliv |
| |
Vygenerovanou adresu (URL) nesoucí informaci o skupinách a počtech dokladů v nich je možné vyhodnotit ve statistické kalkulačce [[manualy:calc|Calc]], konkrétně v modulu [[https://www.korpus.cz/calc/?module=Gr|Víc jevů - 1 vzorek]], který podává přehled o doloženosti jednotlivých skupin a signifikanci rozdílu jejich frekvencí. | Vygenerovanou adresu (URL) nesoucí informaci o skupinách a počtech dokladů v nich je možné vyhodnotit ve statistické kalkulačce [[manualy:calc|Calc]], konkrétně v modulu [[https://www.korpus.cz/calc/?module=Gr|Víc jevů - 1 vzorek]], který podává přehled o doloženosti jednotlivých skupin a signifikanci rozdílu jejich frekvencí. |
| |
| ==== Syntaktický graf ==== |
| |
| V případě, že je korpus [[pojmy:syntakticka_analyza|syntakticky označkován]] (např. [[cnk:syn2015|SYN2015]]), nachází se mezi zaškrtávacím políčkem pro označování řádek a metainformací o textu ikonka {{:manualy:kontext:syntax-tree-icon.png?nolink&20|}} sloužící k vyvolání **syntaktického grafu**. |
| |
<WRAP clear/> | <WRAP clear/> |
==== Promíchat ==== | ==== Promíchat ==== |
| |
V základním nastavení jsou jednotlivé řádky [[pojmy:konkordance|konkordance]] setříděné v pořadí, v jakém je nacházíme v korpusu (např. v korpusu [[cnk:syn2015|SYN2015]] jsou nejprve umístěny texty beletristické, pak odborné a nakonec publicistika). To má výhodu zejména v rychlejším vyhledání odpovídajících řádků. Avšak v případě, že je konkordance rozsáhlá a potřebujeme získat její reprezentativní vzorek (např. pro manuální analýzu), je vhodnější pracovat s náhodně promíchanými řádky. Toho lze dosáhnout právě volbou **Konkordance → Promíchat**. Výsledkem operace je promíchání jednotlivých řádek konkordance, které je sice náhodné, ale zároveň opakovatelné. | V základním nastavení jsou jednotlivé řádky [[pojmy:konkordance|konkordance]] setříděné v pořadí, v jakém je nacházíme v korpusu (např. v korpusu [[cnk:syn2015|SYN2015]] jsou nejprve umístěny texty beletristické, pak odborné a nakonec publicistika). To má výhodu zejména v rychlejším vyhledání odpovídajících řádků. Avšak v případě, že je konkordance rozsáhlá a potřebujeme získat její reprezentativní vzorek (např. pro manuální analýzu), je vhodnější pracovat s náhodně promíchanými řádky. Výsledkem operace **Promíchat** je promíchání jednotlivých řádek konkordance, které je sice náhodné, ale zároveň opakovatelné. |
| |
| Promíchání řádků lze dosáhnout dvěma způsoby: |
| |
| - Před začátkem vyhledávání vybráním volby **Promíchat konkordanční řádky** na stránce **Dotaz → Konkordance** přímo ve vyhledávácím formuláři vedle tlačítka [[manualy:kontext:novy_dotaz#typy_dotazu|Hledat]]. |
| - Po vyhodnocení dotazu samostatnou volbou **Konkordance → Promíchat**. |
| |
| Volbu **Promíchat konkordanční řádky** doporučujeme mít stále zapnutou, což zajistí, že každá konkordance před tím, než je zobrazena, bude nejprve výše popsaným způsobem znáhodněna. (Po prvním přepnutí zůstane volba aktivovaná i pro následující dotazy.) Takovýto postup funguje jako účinná prevence před vytvářením nekorektních závěrů na základě studia vzorku výsledků pocházejících z nereprezentativní sady textů. |
| |
Volbu **Promíchat** doporučujeme užívat automaticky, což zajistí, že každá konkordance před tím, než je zobrazena, bude nejprve tímto způsobem znáhodněna. Trvalé nastavení promíchávání konkordančních řádek lze nastavit v menu **Zobrazení → Obecné volby zobrazení** (volba Automaticky promíchat konkordanční řádky). Takovýto postup funguje jako účinná prevence před vytvářením nekorektních závěrů na základě studia vzorku výsledků pocházejících z nereprezentativní sady textů. | <wrap lo>Poznámka: Volbu je doporučeno vypínat pouze přechodně v případech, kdy lze očekávat rozsáhlou výslednou konkordanci, typicky při hledání frekventovaného jevu v korpusu o velikosti řádově miliardy tokenů. Zvláště u těchto rozsáhlejších výsledků je třeba počítat s tím, že zapnuté promíchání řádků může významně prodloužit dobu čekání na zobrazení konkordance.</wrap> |
| |
Pokud máme ve výchozím nastavení zapnuté míchání konkordančních řádků, volba **Promíchat** provede jejich další náhodné přeuspořádání. Pro každou konkordanci existuje jednoznačný algoritmus promíchávání, který způsobí, že výsledky po prvním, druhém, třetím... //n//-tém promíchání se při opakovaných pokusech na stejném dotazu shodují. To zaručuje opakovatelnost experimentů na korpusech i při použití promíchané konkordance. | Pokud máme konkordanční řádky již jednou promíchané, volba **Konkordance → Promíchat** provede jejich další náhodné přeuspořádání. Pro každou konkordanci existuje jednoznačný algoritmus promíchávání, který způsobí, že výsledky po prvním, druhém, třetím... //n//-tém promíchání se při opakovaných pokusech na stejném dotazu shodují. To zaručuje opakovatelnost experimentů na korpusech i při použití promíchané konkordance. |
| |
==== Vzorek ==== | ==== Vzorek ==== |