Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- manualy:kontext:konkordance [2018/12/13 12:23] – jankocek
+++ manualy:kontext:konkordance [2021/03/01 20:09] – [Třídění] michalskrabal
@@ Řádek 8: / Řádek 8: @@
 ==== Práce s konkordancí ====
+[{{ :kurz:konkordance_kdyz_skoleni_skoncilo_rozsirenikontextu.png?nolink&700|Konkordance s rozšířeným kontextem}}]
 Konkordanční seznam je rozdělen na několik částí. Uprostřed je barevně zvýrazněn [[pojmy:kwic|KWIC]], jenž je obklopen pravým a levým kontextem. V levém sloupci je u každého řádku uvedena stručná informace o zdrojovém textu (její podoba závisí na nastavení v menu [[manualy:kontext:moznosti_zobrazeni|Zobrazení]]). V záhlaví konkordance se nacházejí základní informace, jako je absolutní [[pojmy:frekvence|frekvence]], relativní frekvence ([[pojmy:ipm|i.p.m.]]), [[pojmy:arf|ARF]] a status konkordance (zda je [[manualy:kontext:konkordance#trideni|setříděna]], nebo [[manualy:kontext:konkordance#promichat|promíchána]]). Zcela vpravo jsou umístěny šipky pro prohlížení jednotlivých stránek konkordance.
-[{{ :kurz:konkordance_kdyz_skoleni_skoncilo_rozsirenikontextu.png?nolink&700|Konkordance s rozšířeným kontextem}}]
 V mluvených korpusech je možné přepnout mezi dvěma možnostmi zobrazení rozšířené konkordance: lineární zobrazení kontextu (stejně jako v psaných korpusech), nebo zobrazení podle promluv jednotlivých mluvčích. Zobrazení dialogu podle promluv jednotlivých mluvčích usnadňuje orientaci v transkriptech mluveného jazyka.
@@ Řádek 27: / Řádek 28: @@
 V obou režimech se při označování řádek objeví v záhlaví konkordančního seznamu odkaz s průběžně aktualizovaným počtem vybraných řádek. Oba režimy se však liší v možnostech další práce s označenými řádky, které jsou k dispozici po kliknutí na tento odkaz: zatímco základní výběr vede pouze k odstranění, nebo naopak ponechání vybraných řádků v konkordanci, možnosti práce se skupinami jsou širší. Jako první krok však v tomto případě KonText požaduje uložení zadané klasifikace do skupin, které je nutné pro zachování perzistence -- po uložení se totiž změní URL tak, aby zůstalo jednoznačným identifikátorem zadaného dotazu i provedené klasifikace. Poté je možné zobrazení jednoduché statistiky vybraných skupin, třídění konkordancí podle nich, nebo také návrat k další editaci klasifikace do skupin.
+[{{ :manualy:kontext:podily_skupin.png?450|Podíly označených skupin řádků }}]
+Vygenerovanou adresu (URL) nesoucí informaci o skupinách a počtech dokladů v nich je možné vyhodnotit ve statistické kalkulačce [[manualy:calc|Calc]], konkrétně v modulu [[https://www.korpus.cz/calc/?module=Gr|Víc jevů - 1 vzorek]], který podává přehled o doloženosti jednotlivých skupin a signifikanci rozdílu jejich frekvencí.
 V případě, že je korpus [[pojmy:syntakticka_analyza|syntakticky označkován]] (např. [[cnk:syn2015|SYN2015]]), nachází se mezi tímto zaškrtávacím políčkem a metainformací o textu ikonka {{:manualy:kontext:syntax-tree-icon.png?nolink&20|}} sloužící k vyvolání syntaktického grafu.
-[{{:manualy:kontext:podily_skupin.png?450 |Podíly označených skupin řádků }}]
+<WRAP clear/>
 ===== Třídění =====
@@ Řádek 45: / Řádek 50: @@
 Při **jednoduchém třídění** zvolíme, podle jakého kritéria se má třídit (k výběru je libovolný [[pojmy:atributy_pozicni|poziční]] nebo [[pojmy:atributy_strukturni|strukturní]] atribut) a v jakém rozsahu bude třídění probíhat (zda má být setříděn [[pojmy:kwic|KWIC]], pravý nebo levý kontext). Ve výsledku tak můžeme dostat konkordance abecedně seřazené např. podle prvního předcházejícího slova, podle tvaru klíčového slova, nebo podle [[pojmy:txtype|textového typu]].
-Volba **Počet tokenů ke třídění** určuje rozsah kontextu nebo KWICu (je-li víceslovný), na něž se třídící mechanizmus bude zaměřovat. Zvolíme-li hodnotu 2 pro pravý kontext, budou výsledky setříděny abecedně podle prvního a druhého slova následující za KWICem.
+Volba **Počet tokenů ke třídění** určuje rozsah kontextu nebo KWICu (je-li víceslovný), na něž se třídící mechanismus bude zaměřovat. Zvolíme-li hodnotu 2 pro pravý kontext, budou výsledky setříděny abecedně podle prvního a druhého slova následující za KWICem.
-Volby **Nerozlišovat velikost** a **Zpětně** se aplikují v jednoduchém i víceúrovňovém třídění. V případě volby Nerozlišovat velikost jde o to, zda budou při třídění rozlišována velká/malá písmena ([[pojmy:case-sensitive|case-sensitive]]) nebo zda budou chápána jako stejný znak ([[pojmy:case-insensitive|case-insensitive]]). Druhá volba pak umožňuje klasické abecední třídění (nezaškrtnuto) nebo třídění retrográdní, tj. abecední třídění podle konce slova (nikoli podle jeho začátku, jak je běžné).
+Volby **Nerozlišovat velikost** a **Retrográdně** se aplikují v jednoduchém i víceúrovňovém třídění. V případě první volby jde o to, zda budou při třídění rozlišována velká/malá písmena ([[pojmy:case-sensitive|case-sensitive]]), nebo zda budou chápána jako stejný znak ([[pojmy:case-insensitive|case-insensitive]]). Druhá volba pak umožňuje klasické abecední třídění (nezaškrtnuto), nebo třídění retrográdní, tj. abecední třídění podle konce slova (nikoli podle jeho začátku, jak je běžné).
 **Víceúrovňové třídění** umožňuje kombinovat všechny možné způsoby třídění do maximálně čtyřstupňové hierarchie. Je tedy možné třídit konkordanci v 1. úrovni podle textového typu, konkordance se stejným textovým typem jsou pak tříděny v 2. úrovni (např. podle prvního pravého kontextového slova) a ve 3. úrovni podle klíčového slova samotného.

Historie: • konkordance • czesl-sgt-basic • t-score • precision • totalita • kontext_verze • seznamy • arf • corpus_based • syn2005

Rozdíly

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence