Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
manualy:kontext:konkordance [2018/12/13 12:23] – jankocek | manualy:kontext:konkordance [2021/03/01 20:09] – [Třídění] michalskrabal |
---|
| |
==== Práce s konkordancí ==== | ==== Práce s konkordancí ==== |
| |
| [{{ :kurz:konkordance_kdyz_skoleni_skoncilo_rozsirenikontextu.png?nolink&700|Konkordance s rozšířeným kontextem}}] |
| |
Konkordanční seznam je rozdělen na několik částí. Uprostřed je barevně zvýrazněn [[pojmy:kwic|KWIC]], jenž je obklopen pravým a levým kontextem. V levém sloupci je u každého řádku uvedena stručná informace o zdrojovém textu (její podoba závisí na nastavení v menu [[manualy:kontext:moznosti_zobrazeni|Zobrazení]]). V záhlaví konkordance se nacházejí základní informace, jako je absolutní [[pojmy:frekvence|frekvence]], relativní frekvence ([[pojmy:ipm|i.p.m.]]), [[pojmy:arf|ARF]] a status konkordance (zda je [[manualy:kontext:konkordance#trideni|setříděna]], nebo [[manualy:kontext:konkordance#promichat|promíchána]]). Zcela vpravo jsou umístěny šipky pro prohlížení jednotlivých stránek konkordance. | Konkordanční seznam je rozdělen na několik částí. Uprostřed je barevně zvýrazněn [[pojmy:kwic|KWIC]], jenž je obklopen pravým a levým kontextem. V levém sloupci je u každého řádku uvedena stručná informace o zdrojovém textu (její podoba závisí na nastavení v menu [[manualy:kontext:moznosti_zobrazeni|Zobrazení]]). V záhlaví konkordance se nacházejí základní informace, jako je absolutní [[pojmy:frekvence|frekvence]], relativní frekvence ([[pojmy:ipm|i.p.m.]]), [[pojmy:arf|ARF]] a status konkordance (zda je [[manualy:kontext:konkordance#trideni|setříděna]], nebo [[manualy:kontext:konkordance#promichat|promíchána]]). Zcela vpravo jsou umístěny šipky pro prohlížení jednotlivých stránek konkordance. |
| |
[{{ :kurz:konkordance_kdyz_skoleni_skoncilo_rozsirenikontextu.png?nolink&700|Konkordance s rozšířeným kontextem}}] | |
| |
V mluvených korpusech je možné přepnout mezi dvěma možnostmi zobrazení rozšířené konkordance: lineární zobrazení kontextu (stejně jako v psaných korpusech), nebo zobrazení podle promluv jednotlivých mluvčích. Zobrazení dialogu podle promluv jednotlivých mluvčích usnadňuje orientaci v transkriptech mluveného jazyka. | V mluvených korpusech je možné přepnout mezi dvěma možnostmi zobrazení rozšířené konkordance: lineární zobrazení kontextu (stejně jako v psaných korpusech), nebo zobrazení podle promluv jednotlivých mluvčích. Zobrazení dialogu podle promluv jednotlivých mluvčích usnadňuje orientaci v transkriptech mluveného jazyka. |
| |
V obou režimech se při označování řádek objeví v záhlaví konkordančního seznamu odkaz s průběžně aktualizovaným počtem vybraných řádek. Oba režimy se však liší v možnostech další práce s označenými řádky, které jsou k dispozici po kliknutí na tento odkaz: zatímco základní výběr vede pouze k odstranění, nebo naopak ponechání vybraných řádků v konkordanci, možnosti práce se skupinami jsou širší. Jako první krok však v tomto případě KonText požaduje uložení zadané klasifikace do skupin, které je nutné pro zachování perzistence -- po uložení se totiž změní URL tak, aby zůstalo jednoznačným identifikátorem zadaného dotazu i provedené klasifikace. Poté je možné zobrazení jednoduché statistiky vybraných skupin, třídění konkordancí podle nich, nebo také návrat k další editaci klasifikace do skupin. | V obou režimech se při označování řádek objeví v záhlaví konkordančního seznamu odkaz s průběžně aktualizovaným počtem vybraných řádek. Oba režimy se však liší v možnostech další práce s označenými řádky, které jsou k dispozici po kliknutí na tento odkaz: zatímco základní výběr vede pouze k odstranění, nebo naopak ponechání vybraných řádků v konkordanci, možnosti práce se skupinami jsou širší. Jako první krok však v tomto případě KonText požaduje uložení zadané klasifikace do skupin, které je nutné pro zachování perzistence -- po uložení se totiž změní URL tak, aby zůstalo jednoznačným identifikátorem zadaného dotazu i provedené klasifikace. Poté je možné zobrazení jednoduché statistiky vybraných skupin, třídění konkordancí podle nich, nebo také návrat k další editaci klasifikace do skupin. |
| |
| [{{ :manualy:kontext:podily_skupin.png?450|Podíly označených skupin řádků }}] |
| |
| Vygenerovanou adresu (URL) nesoucí informaci o skupinách a počtech dokladů v nich je možné vyhodnotit ve statistické kalkulačce [[manualy:calc|Calc]], konkrétně v modulu [[https://www.korpus.cz/calc/?module=Gr|Víc jevů - 1 vzorek]], který podává přehled o doloženosti jednotlivých skupin a signifikanci rozdílu jejich frekvencí. |
| |
V případě, že je korpus [[pojmy:syntakticka_analyza|syntakticky označkován]] (např. [[cnk:syn2015|SYN2015]]), nachází se mezi tímto zaškrtávacím políčkem a metainformací o textu ikonka {{:manualy:kontext:syntax-tree-icon.png?nolink&20|}} sloužící k vyvolání syntaktického grafu. | V případě, že je korpus [[pojmy:syntakticka_analyza|syntakticky označkován]] (např. [[cnk:syn2015|SYN2015]]), nachází se mezi tímto zaškrtávacím políčkem a metainformací o textu ikonka {{:manualy:kontext:syntax-tree-icon.png?nolink&20|}} sloužící k vyvolání syntaktického grafu. |
| |
[{{:manualy:kontext:podily_skupin.png?450 |Podíly označených skupin řádků }}] | <WRAP clear/> |
| |
===== Třídění ===== | ===== Třídění ===== |
Při **jednoduchém třídění** zvolíme, podle jakého kritéria se má třídit (k výběru je libovolný [[pojmy:atributy_pozicni|poziční]] nebo [[pojmy:atributy_strukturni|strukturní]] atribut) a v jakém rozsahu bude třídění probíhat (zda má být setříděn [[pojmy:kwic|KWIC]], pravý nebo levý kontext). Ve výsledku tak můžeme dostat konkordance abecedně seřazené např. podle prvního předcházejícího slova, podle tvaru klíčového slova, nebo podle [[pojmy:txtype|textového typu]]. | Při **jednoduchém třídění** zvolíme, podle jakého kritéria se má třídit (k výběru je libovolný [[pojmy:atributy_pozicni|poziční]] nebo [[pojmy:atributy_strukturni|strukturní]] atribut) a v jakém rozsahu bude třídění probíhat (zda má být setříděn [[pojmy:kwic|KWIC]], pravý nebo levý kontext). Ve výsledku tak můžeme dostat konkordance abecedně seřazené např. podle prvního předcházejícího slova, podle tvaru klíčového slova, nebo podle [[pojmy:txtype|textového typu]]. |
| |
Volba **Počet tokenů ke třídění** určuje rozsah kontextu nebo KWICu (je-li víceslovný), na něž se třídící mechanizmus bude zaměřovat. Zvolíme-li hodnotu 2 pro pravý kontext, budou výsledky setříděny abecedně podle prvního a druhého slova následující za KWICem. | Volba **Počet tokenů ke třídění** určuje rozsah kontextu nebo KWICu (je-li víceslovný), na něž se třídící mechanismus bude zaměřovat. Zvolíme-li hodnotu 2 pro pravý kontext, budou výsledky setříděny abecedně podle prvního a druhého slova následující za KWICem. |
| |
Volby **Nerozlišovat velikost** a **Zpětně** se aplikují v jednoduchém i víceúrovňovém třídění. V případě volby Nerozlišovat velikost jde o to, zda budou při třídění rozlišována velká/malá písmena ([[pojmy:case-sensitive|case-sensitive]]) nebo zda budou chápána jako stejný znak ([[pojmy:case-insensitive|case-insensitive]]). Druhá volba pak umožňuje klasické abecední třídění (nezaškrtnuto) nebo třídění retrográdní, tj. abecední třídění podle konce slova (nikoli podle jeho začátku, jak je běžné). | Volby **Nerozlišovat velikost** a **Retrográdně** se aplikují v jednoduchém i víceúrovňovém třídění. V případě první volby jde o to, zda budou při třídění rozlišována velká/malá písmena ([[pojmy:case-sensitive|case-sensitive]]), nebo zda budou chápána jako stejný znak ([[pojmy:case-insensitive|case-insensitive]]). Druhá volba pak umožňuje klasické abecední třídění (nezaškrtnuto), nebo třídění retrográdní, tj. abecední třídění podle konce slova (nikoli podle jeho začátku, jak je běžné). |
| |
**Víceúrovňové třídění** umožňuje kombinovat všechny možné způsoby třídění do maximálně čtyřstupňové hierarchie. Je tedy možné třídit konkordanci v 1. úrovni podle textového typu, konkordance se stejným textovým typem jsou pak tříděny v 2. úrovni (např. podle prvního pravého kontextového slova) a ve 3. úrovni podle klíčového slova samotného. | **Víceúrovňové třídění** umožňuje kombinovat všechny možné způsoby třídění do maximálně čtyřstupňové hierarchie. Je tedy možné třídit konkordanci v 1. úrovni podle textového typu, konkordance se stejným textovým typem jsou pak tříděny v 2. úrovni (např. podle prvního pravého kontextového slova) a ve 3. úrovni podle klíčového slova samotného. |