AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
manualy:kontext:frekvence [2018/11/05 23:19] – [Vlastní nastavení frekvenční distribuce] Michal Škrabalmanualy:kontext:frekvence [2023/04/05 17:27] (aktuální) – stará verze byla obnovena (2023/04/02 20:35) Michal Křen
Řádek 1: Řádek 1:
 ====== Menu: Frekvence ====== ====== Menu: Frekvence ======
  
-Pod označením **Frekvence** se v menu rozhraní KonText nachází funkce pro vytváření frekvenčních distribucí. Pomocí ní je možné získat přehled [[pojmy:typ|typů]] (např. různých slov) ve výsledku hledání spolu s jejich frekvencí. Vyhledáme-li např. všechna substantiva v gen. pl., můžeme pomocí této funkce zjistit, jaké [[pojmy:word|tvary]] se v tomto pádě a čísle vyskytují a jak často. Stejně tak je ale možné frekvenční distribuci použít na zjišťování frekvencí jednotek předcházejících či následujících, počítání [[pojmy:lemma|lemmat]] v [[pojmy:konkordance|konkordanci]]nebo pro zjištění distribuce hledaného jevu napříč různými texty či jejich skupinami (podle [[pojmy:genre|genre]], [[pojmy:txtype|txtype]] apod.).+Pod označením **Frekvence** se v menu rozhraní KonText nachází funkce pro vytváření frekvenčních distribucí. Pomocí ní je možné získat přehled [[pojmy:typ|typů]] (např. různých slov) ve výsledku hledání spolu s jejich frekvencí. Vyhledáme-li např. všechna substantiva v gen. pl., můžeme pomocí této funkce zjistit, jaké [[pojmy:word|tvary]] se v tomto pádě a čísle vyskytují a jak často. Stejně tak je ale možné frekvenční distribuci použít na zjišťování frekvencí jednotek předcházejících či následujících, počítání [[pojmy:lemma|lemmat]] v [[pojmy:konkordance|konkordanci]] nebo pro zjištění distribuce hledaného jevu napříč různými texty či jejich skupinami (podle [[pojmy:genre|genre]], [[pojmy:txtype|txtype]] apod.).
  
-Frekvenční distribuce umožňuje jednak vlastní (obecné) nastavení jednak rychlé volby (ty jsou přístupné v druhé úrovni menu)+Frekvenční distribuce umožňuje jednak vlastní (obecné) nastaveníjednak rychlé volby (ty jsou přístupné v druhé úrovni menu).
-  - **Lemmata** -- vyhodnotí dotaz ([[pojmy:kwic|KWIC]]) a vypíše všechna různá lemmata (atribut [[pojmy:lemma|lemma]]) spolu s jejich frekvencí((Volba je dostupná pouze u korpusů disponujících lemmatizací)) +
-  - **Slovní tvary** -- vyhodnotí dotaz (KWIC) a vypíše všechny různé tvary (atribut [[pojmy:word|word]]) spolu s jejich frekvencí +
-  - **Dokumenty** -- vyhodnotí celou [[pojmy:konkordance|konkordanci]] a vypíše identifikátory textů (konkrétní [[pojmy:atributy_strukturni|strukturní atribut]] se může lišit v závislosti na vybraném korpusu), v nichž se hledaný jev vyskytuje, spolu s frekvencí tohoto jevu v jednotlivých textech +
-  - **Typy textů** -- vyhodnotí celou konkordanci a vypíše přehled strukturních atributů((Inventář strukturních atributů se u korpusů může lišit, podle toho se liší i výsledek vygenerovaný touto volbou)), které se vztahují k typu textu (strukturní atributy ''[[pojmy:txtype|txtype]]'', ''[[pojmy:genre|genre]]'' apod.), spolu s jejich frekvencí (význam jednotlivých zkratek je k dispozici v [[seznamy:index#zkratky_a_kody|seznamu zkratek a kódů]])+
  
 Podobnou funkcionalitu, která se ovšem většinou vztahuje na celý korpus (nikoli pouze na jednu konkrétní konkordanci), poskytuje také funkce **[[manualy:kontext:novy_dotaz#seznam_slov|Nový dotaz → Seznam slov]]**. Podobnou funkcionalitu, která se ovšem většinou vztahuje na celý korpus (nikoli pouze na jednu konkrétní konkordanci), poskytuje také funkce **[[manualy:kontext:novy_dotaz#seznam_slov|Nový dotaz → Seznam slov]]**.
 +
 +===== Rychlé volby frekvenční distribuce =====
 +
 +==== Lemmata ====
 +
 +Vyhodnotí dotaz ([[pojmy:kwic|KWIC]]) a vypíše všechna různá lemmata (atribut [[pojmy:lemma|lemma]]) spolu s jejich frekvencí((Volba je dostupná pouze u korpusů disponujících lemmatizací.)).
 +
 +==== Slovní tvary [A=a] ====
 +
 +Vyhodnotí dotaz (KWIC) a vypíše všechny různé tvary (atribut [[pojmy:word|word]] bez ohledu na velikost písmen) spolu s jejich frekvencí.
 +
 +==== Dokumenty ====
 +
 +Vyhodnotí celou [[pojmy:konkordance|konkordanci]] a vypíše identifikátory textů (konkrétní [[pojmy:atributy_strukturni|strukturní atribut]] se může lišit v závislosti na vybraném korpusu), v nichž se hledaný jev vyskytuje, spolu s frekvencí tohoto jevu v jednotlivých textech.
 +
 +==== Typy textů ====
 +
 +Vyhodnotí celou konkordanci a vypíše přehled strukturních atributů((Inventář strukturních atributů se u korpusů může lišit, podle toho se liší i výsledek vygenerovaný touto volbou)), které se vztahují k typu textu (strukturní atributy ''[[pojmy:txtype|txtype]]'', ''[[pojmy:genre|genre]]'' apod.), spolu s jejich frekvencí (význam jednotlivých zkratek je k dispozici v [[seznamy:index#zkratky_a_kody|seznamu zkratek a kódů]]).
 +
 +===== Frekvenční seznam =====
 +
 +Výsledkem funkce frekvenční distribuce je zobrazení frekvenčního seznamu, a to jednak ve formě tabulky četností, jednak v podobě grafů. 
 +
 +Následující příklad využití frekvenční distribuce se vztahuje ke korpusu [[cnk:syn2020|SYN2020]] a dotazu na [[pojmy:lemma|lemma]] //dřevo// (''[lemma=%%"%%dřevo%%"%%]''): Frekvenční distribuce slovních tvarů lemmatu //dřevo// bez rozlišování velikosti písmen (volba **Slovní tvary [A=a]**).
 +
 +==== Tabulkové zobrazení ====
 +
 +[{{ :manualy:kontext:fqdist-word-drevo_tab.png?direct&400|Frekvenční distribuce slovních tvarů lemmatu //dřevo// (včetně zobrazení konfidenčních intervalů)}}]
 +
 +Výchozím způsobem zobrazení je tabulka s uvedením absolutních a relativních frekvencí pro jednotlivé položky (včetně možnosti zobrazení konfidenčních intervalů). 
 +
 +U každého slovního tvaru (atribut [[pojmy:word|word]]) vypsaného ve frekvenční distribuci lemmatu //dřevo// se objevuje několik informací. Základní je informace ve sloupci frekvence, která udává **absolutní četnost** dané jednotky ve vyhledané konkordanci (byla-li konkordance před zadáním frekvenční distribuce nějak měněna – např. pomocí [[manualy:kontext:filtr|filtrů]] či [[manualy:kontext:konkordance#vzorek|vzorků]] – bude i frekvenční seznam tyto změny reflektovat). V seznamu se zobrazí všechny položky s alespoň jednotkovým výskytem. Chceme-li výpis zúžit, můžeme nastavit **Minimální frekvenci** na hodnotu, která vyhovuje konkrétní situaci.
 +
 +Vedle sloupce s absolutní frekvencí se objevuje i položka [[pojmy:ipm|i.p.m.]] Vyjadřuje **relativní četnost** zkoumaných jevů vzhledem k celkové velikosti korpusu. V našem případě se tvar //dřeva// objevuje v korpusu [[cnk:syn2020|SYN2020]] s absolutní četností 5 712, což představuje 46,89 výskytů na milion slov (i.p.m.). 
 +
 +Pro hodnoty absolutní i relativní frekvence lze pomocí další volby zobrazit i hodnoty **[[pojmy:konfidencni_intervaly|konfidenčních intervalů]]**, tj. rozsahy, v nichž by se dané frekvence (s pravděpodobností na určené **konfidenční hladině**) vyskytovaly v jiných, podobně sestavených korpusech srovnatelné velikosti. Konfidenční hladina je nastavena na 95 % a je možné ji uživatelsky změnit pomocí volby na 99 % nebo 90 %. 
 +
 +V seznamu nalevo od slovního tvaru jsou odkazy **p/n**, které slouží pro rychlé vyvolání **pozitivního a negativního [[manualy:kontext:filtr|filtru]]**. Kliknutím na **p** v řádku reprezentujícím frekvenci tvaru //dřeva// vyfiltrujeme ze stávající konkordance pouze tento tvar, analogicky po aktivaci **n** budou z aktuální konkordance vyloučeny všechny výskyty daného tvaru.
 +
 +Při kliknutí na nadpis sloupce se tabulka automaticky podle zvoleného sloupce přetřídí. Je tak možné získat i seznam setříděný abecedně (vedle běžného frekvenčně seřazeného výpisu).
 +
 +Pomocí funkce **Sdílet tabulku** (odkaz je umístěn v řádku nad tabulkou) se vygeneruje trvalý odkaz na tabulku, který lze přímo z okna formuláře poslat na zadanou adresu e-mailem nebo později uvést v článku, studii apod.
 +
 +==== Zobrazení v grafech ====
 +
 +Grafické zobrazení umožňuje vizualizovat informace představené v předchozím oddílu (absolutní a relativní frekvence položek s jejich konfidenčními intervaly) do podoby dvou typů grafů: horizontálního **sloupcového grafu** a grafu typu "**word cloud**".
 +
 +[{{:manualy:kontext:fqdist-word-drevo.png?direct&350|Typ grafu: sloupcový graf }}]
 +\\
 +Ve výchozím nastavení se zobrazuje sloupcový graf s hodnotami relativních četností včetně konfidenčních intervalů na hladině 95 %. 
 +
 +Po rozkliknutí voleb nad grafem pomocí **(+)** je možné vlastnosti grafu upravit. Místo hodnot relativní četnosti lze zobrazit četnosti absolutní, dále lze omezit počet položek v grafu, seřadit položky podle abecedy namísto frekvenčního třídění a také exportovat graf jako obrázek.
 +
 +Nakonec je možné graf přepnout do podoby grafu typu "word cloud", který zobrazuje skupinu zkoumaných položek (v našem příkladů tvarů slov) ve velikostech poměrně odpovídající jejich četnostem. Pro tento typ grafu je v uživatelském nastavení relevantní pouze možnost exportu grafu a omezení počtu položek v grafu.
 +
 +[{{:manualy:kontext:fqdist-word-cloud.png?direct&350|Typ grafu: "word cloud" }}]
 +\\
 +
 ===== Vlastní nastavení frekvenční distribuce ===== ===== Vlastní nastavení frekvenční distribuce =====
  
-Formulář, který se zobrazí po kliknutí na volbu **Frekvence → Vlastní** (resp. po klávesové zkratce ''Shift'' + ''F'' na obrazovce s konkordancí), má tři možnosti:+Formulář, který se zobrazí po kliknutí na volbu **Frekvence → Vlastní** (resp. po klávesové zkratce ''Shift'' + ''F'' na obrazovce s konkordancí), má čtyři možnosti:
  
-  - běžnou frekvenční distribuci (slouží k analýze [[pojmy:atributy_pozicni|pozičních atributů]], jako je [[pojmy:word|word]], [[pojmy:lemma|lemma]], [[pojmy:tag|tag]] apod., v rámci KWIC nebo v jeho okolí pomocí přidání dalších úrovní)+  - běžnou frekvenční distribuci (slouží k analýze [[pojmy:atributy_pozicni|pozičních atributů]], jako je [[pojmy:word|word]], [[pojmy:lemma|lemma]], [[pojmy:lemma#sublemma|sublemma]], [[pojmy:tag|tag]], [[pojmy:verbtag|verbtag]] apod., v rámci KWIC nebo v jeho okolí pomocí přidání dalších úrovní)
   - frekvenční distribuci podle typů textu neboli [[pojmy:atributy_strukturni|strukturních atributů]] (jako je ''[[pojmy:txtype|txtype]]'', ''[[pojmy:genre|genre]]'' nebo ''[[pojmy:srclang|srclang]]'')   - frekvenční distribuci podle typů textu neboli [[pojmy:atributy_strukturni|strukturních atributů]] (jako je ''[[pojmy:txtype|txtype]]'', ''[[pojmy:genre|genre]]'' nebo ''[[pojmy:srclang|srclang]]'')
 +  - disperzi znázorňující rozložení hledané konkordance napříč celým korpusem
   - frekvenční distribuci odrážející vzájemný vztah dvou atributů (pozičních i strukturních)   - frekvenční distribuci odrážející vzájemný vztah dvou atributů (pozičních i strukturních)
  
Řádek 22: Řádek 77:
 ==== Běžná frekvenční distribuce ==== ==== Běžná frekvenční distribuce ====
  
-Běžná frekvenční distribuce umožňuje počítat frekvenční distribuci na libovolné pozici konkordance v rozmezí 6 pozic nalevo až 6 pozic napravo od [[pojmy:kwic|KWICu]]. Ve formuláři je nejprve třeba zvolit, jaký **atribut** chceme ve frekvenční distribuci počítat (např. v korpusech [[cnk:syn|řady SYN]] jsou k dispozici základní [[pojmy:atributy_pozicni|poziční atributy]] word, lemma, tag, lc, pos). +Běžná frekvenční distribuce umožňuje počítat frekvenční distribuci na libovolné pozici konkordance v rozmezí 6 pozic nalevo až 6 pozic napravo od [[pojmy:kwic|KWICu]]. Ve formuláři je nejprve třeba zvolit, jaký **atribut** chceme ve frekvenční distribuci počítat (např. v nových korpusech [[cnk:syn|řady SYN]] jsou k dispozici [[pojmy:atributy_pozicni|poziční atributy]] word, lemma, sublemma, tag, verbtag, lc, pos, case). 
  
 Dále je třeba zvolit, zda se frekvenční distribuce má počítat s ohledem na velikost písmen. Při volbě [[pojmy:case-insensitive|case-insensitive]] jsou všechny položky převedeny na malá písmena bez ohledu na to, s jakou velikostí písmen se reálně v korpusu objevují. Dále je třeba zvolit, zda se frekvenční distribuce má počítat s ohledem na velikost písmen. Při volbě [[pojmy:case-insensitive|case-insensitive]] jsou všechny položky převedeny na malá písmena bez ohledu na to, s jakou velikostí písmen se reálně v korpusu objevují.
Řádek 30: Řádek 85:
 Při vlastním nastavení frekvenční distribuce se nemusíme omezovat pouze na KWIC (jako je tomu v případě rychlých voleb). Může být počítána z kterékoli kontextové pozice v pravém nebo levém okolí od hledaného slova. Položka **Pozice** ve formuláři umožňuje vybrat jak pozice v levém (předcházejícím) kontextu (6L--1L), samotný KWIC, tak pozice v pravém (následujícím) kontextu (1R--6R). Číslování pozic (podle současné i starší notace) shrnuje následující tabulka: Při vlastním nastavení frekvenční distribuce se nemusíme omezovat pouze na KWIC (jako je tomu v případě rychlých voleb). Může být počítána z kterékoli kontextové pozice v pravém nebo levém okolí od hledaného slova. Položka **Pozice** ve formuláři umožňuje vybrat jak pozice v levém (předcházejícím) kontextu (6L--1L), samotný KWIC, tak pozice v pravém (následujícím) kontextu (1R--6R). Číslování pozic (podle současné i starší notace) shrnuje následující tabulka:
  
-^ konkordance  | místnosti | . | Byly | z | těžkého | tmavého |  **<fc #FF0000>dřeva</fc>**  | a | zlověstně | zaskřípaly | . | Poslepu | jsem |+^ konkordance  | místnosti | . | Byly | z | těžkého | tmavého   |  **<fc #FF0000>dřeva</fc>**  | a | zlověstně | zaskřípaly | . | Poslepu | jsem |
 ^ pozice  |  6L  |  5L  |  4L  |  3L  |  2L  |  1L  |  <fc #FF0000>KWIC</fc>  |  1R  |  2R  |  3R  |  4R  |  5R  |  6R  | ^ pozice  |  6L  |  5L  |  4L  |  3L  |  2L  |  1L  |  <fc #FF0000>KWIC</fc>  |  1R  |  2R  |  3R  |  4R  |  5R  |  6R  |
 ^ pozice (starší notace)  |  -6  |  -5  |  -4  |  -3  |  -2  |  -1  |  <fc #FF0000>KWIC</fc>  |  1  |  2  |  3  |  4  |  5  |  6  | ^ pozice (starší notace)  |  -6  |  -5  |  -4  |  -3  |  -2  |  -1  |  <fc #FF0000>KWIC</fc>  |  1  |  2  |  3  |  4  |  5  |  6  |
Řádek 36: Řádek 91:
 S určováním pozice toho, co má být předmětem výpočtu frekvenční distribuce, může nastat problém v případě, že hledaný KWIC je víceslovný (např. při hledání fráze //dřevo a uhlí//). Pak je třeba specifikovat, kterou hranici KWICu považujeme za výchozí pro výpočet (zda pravou, nebo levou), což umožňuje položka **(Node) začít od**. Tabulka shrnuje, jak se změní označení kontextových pozic podle toho, který z konců víceslovného KWICu určíme za rozhodující. S určováním pozice toho, co má být předmětem výpočtu frekvenční distribuce, může nastat problém v případě, že hledaný KWIC je víceslovný (např. při hledání fráze //dřevo a uhlí//). Pak je třeba specifikovat, kterou hranici KWICu považujeme za výchozí pro výpočet (zda pravou, nebo levou), což umožňuje položka **(Node) začít od**. Tabulka shrnuje, jak se změní označení kontextových pozic podle toho, který z konců víceslovného KWICu určíme za rozhodující.
  
-^ konkordance  | znečišťování | ovzduší | . | Moderní | kotle | na |  **<fc #FF0000>dřevo</fc>** | **<fc #FF0000>a</fc>** | **<fc #FF0000>uhlí</fc>**  | splňují | dnes | všechny | požadavky | z | hlediska | +^ konkordance  | znečišťování | ovzduší | . | Moderní | kotle | na |  **<fc #FF0000>dřevo</fc>** | **<fc #FF0000>a</fc>** | **<fc #FF0000>uhlí</fc>**  | splňují | dnes | všechny | požadavky | z | hlediska |
 ^ pozice (počítáno zleva) |  6L  |  5L  |  4L  |  3L  |  2L  |  1L  |  <fc #FF0000>KWIC</fc>  |  <fc #FF0000>1R</fc>  |  <fc #FF0000>2R</fc>  |  3R  |  4R  |  5R  |  6R  | 7R | 8R | ^ pozice (počítáno zleva) |  6L  |  5L  |  4L  |  3L  |  2L  |  1L  |  <fc #FF0000>KWIC</fc>  |  <fc #FF0000>1R</fc>  |  <fc #FF0000>2R</fc>  |  3R  |  4R  |  5R  |  6R  | 7R | 8R |
 ^ pozice (počítáno zprava) |  8L  |  7L  |  6L  |  5L  |  4L  |  3L  |  <fc #FF0000>2L</fc>  |  <fc #FF0000>1L</fc>  |  <fc #FF0000>KWIC</fc>  |  1R  |  2R  |  3R  |  4R  | 5R | 6R | ^ pozice (počítáno zprava) |  8L  |  7L  |  6L  |  5L  |  4L  |  3L  |  <fc #FF0000>2L</fc>  |  <fc #FF0000>1L</fc>  |  <fc #FF0000>KWIC</fc>  |  1R  |  2R  |  3R  |  4R  | 5R | 6R |
Řádek 45: Řádek 100:
  
 ==== Frekvenční distribuce podle typů textů ==== ==== Frekvenční distribuce podle typů textů ====
 +
 +[{{ :manualy:kontext:fqdist-txtype-drevo.png?direct&300|Frekvenční distribuce textových typů a jejich skupin lemmatu //dřevo// }}]
  
 Frekvenční distribuci podle typů textů použijeme naopak v situacích, kdy těžiště výzkumného zájmu spočívá v textech, z nichž výskyty v konkordanci pocházejí (pokud nás tedy zajímá [[pojmy:txtype|typ textu]], [[pojmy:srclang|zdrojový jazyk]], [[pojmy:medium|médium]] apod.). Frekvenční distribuci podle typů textů použijeme naopak v situacích, kdy těžiště výzkumného zájmu spočívá v textech, z nichž výskyty v konkordanci pocházejí (pokud nás tedy zajímá [[pojmy:txtype|typ textu]], [[pojmy:srclang|zdrojový jazyk]], [[pojmy:medium|médium]] apod.).
Řádek 52: Řádek 109:
 I zde můžeme nastavit frekvenční limit, chceme-li omezit počet výsledků v seznamu. Zároveň je ale možné pomocí volby **Zahrnout i kategorie bez výskytů** zobrazit v seznamu ty hodnoty atributů, které se v konkordanci vůbec neobjevily. Např. lemma //dřevo// se v SYN2010 ani jednou neobjevuje v písních (txtype [[seznamy:txtype|SON]]). Je-li tato volba zaškrtnuta, txtype SON se ve frekvenční distribuci přesto objeví, a to s nulovou frekvencí. I zde můžeme nastavit frekvenční limit, chceme-li omezit počet výsledků v seznamu. Zároveň je ale možné pomocí volby **Zahrnout i kategorie bez výskytů** zobrazit v seznamu ty hodnoty atributů, které se v konkordanci vůbec neobjevily. Např. lemma //dřevo// se v SYN2010 ani jednou neobjevuje v písních (txtype [[seznamy:txtype|SON]]). Je-li tato volba zaškrtnuta, txtype SON se ve frekvenční distribuci přesto objeví, a to s nulovou frekvencí.
  
-==== Závislost dvou atributů ====+=== Příklad využití: frekvenční seznam podle typů textů ===
  
-[{{ :manualy:kontext:2d-fqdist.png?nolink&450|Výsledek dvoudimenzionální frekvenční distribuce}}] +Následující příklad využití frekvenční distribuce se vztahuje ke korpusu [[cnk:syn2020|SYN2020]] a dotazu na [[pojmy:lemma|lemma]] //dřevo// (''[lemma=%%"%%dřevo%%"%%]''): Frekvenční distribuce hodnot strukturních atributů ''txtype'' a ''txtype_group'' lemmatu //dřevo// (bez hodnot s nulovou frekvencí).
  
-Poslední typ frekvenční distribuce odráží vzájemný vztah dvou atributů, a to jak pozičních, tak strukturníchTakto můžeme zjistit například to, jaká jmenná adjektiva (''%%[tag="AC.*"]%%'') jsou typická pro jednotlivé žánry či typy textů (pro SYN2015). V menu **Frekvence → Vlastní** zvolíme možnost **Závislost dvou atributů** a tyto dva atributy vybereme z nabídky, v našem případě jako první atribut (tabulce výsledky se bude zobrazovat v řádcích) zvolíme **lemma**, jako druhý (zobrazovaný ve sloupcích**doc.txtype_group** (pod Typy textů)Rovněž můžeme nastavit minimální hodnoty, ať už ve [[pojmy:frekvence|frekvenci absolutní či relativní]] anebo v percentilech jedné z nich.+Výpis frekvenční distribuce podle **strukturních atributů** má stejnou strukturu jako výpis podle pozičních atributůZvláštní důležitost zde má hodnota [[pojmy:ipm|i.p.m.]], která se zobrazuje u každé položky (hodnoty strukturního atributu, který jsme zvolili). Vyjadřuje relativní četnost jevů zobrazených konkordanci vzhledem k celkové velikosti části korpusu s danou hodnotou strukturního atributu. V našem případě se lemma //dřevo// objevuje korpusu [[cnk:syn2020|SYN2020]] četností 3566 oborové literatuř(NFC). Vzhledem k celkovému podílu oborové literatury v korpusu (33 %) to představuje 88,55 výskytů na milion slov (i.p.m.).
  
-Po potvrzení volby **Vytvořit frekvenční seznam** se objeví tabulka s počty výskytů jednotlivých adjektiv ve třech [[pojmy:txtype_group|makrotřídách textů]] (tedy v beletrii, oborové literatuře a publicistice), řazenými defaultně podle frekvence sestupně. Zobrazení výsledků je možno podle potřeb dále měnit: střídat absolutní frekvenci s relativní ([[pojmy:ipm|i.p.m.]]) či epnout orientaci řádků a sloupcůpřípadně namísto tabulky zobrazit seznam dvojic daných atributů. V rámci pokročilých voleb lze mj. třídit řádky podle trojího kritéria (hodnota atributu, součet absolutní/relativní frekvence v řádku či sloupci)nastavit [[kurz:konfidencni_intervaly|konfidenční interval]] či mapování barev (bližší informace -- viz ikonka otazníku vedle volby **Mapování barev**). Při zobrazení relativních frekvencí (i.p.m.) lze pomocí ikony grafu zobrazit distribuci jevu řádku nebo ve sloupci pomocí grafu s naznačenými konfidenčními intervaly.+Stejně jako u jednotek pozičních je u strukturních atributů možné tabulku etřídit podle libovolného sloupce; výhodné je to zejména v situacikdy potřebujeme znát pořadí podle relativní četnostikterá umožňuje srovnání počtu výskytů i v nestejně velkých částech korpusu.
  
-===== Frekvenční seznam (výpis) =====+==== Disperze ====
  
-[{{ :manualy:kontext:fqdist-word-drevo.png?direct&300|Frekvenční distribuce slovních tvarů lemmatu //dřevo// }}]+Funkce [[pojmy:frekvence#disperze_jevu|Disperze]] umožňuje graficky znázornit rozložení daného vyhledaného jevu napříč textem/korpusem. V úvodním formuláři je třeba nastavit počet úseků (nejvýše 1000), na něž bude korpus pro účel zobrazení disperze rozdělen. Ve výsledném grafu jsou pak na ose //y// zaneseny počty výskytů vyhledaného jevu pro každý úsek. 
 +[{{:manualy:kontext:disperze.png?direct&450|Disperze lemmatu //dřevo// (rozdělení na 100 úseků) v SYN2020 }}] 
 +\\
  
-Následující příklady využití frekvenční distribuce se vztahují ke korpusu [[cnk:syn2015|SYN2015]] a dotazu na [[pojmy:lemma|lemma]] //dřevo// (''[lemma=%%"%%dřevo%%"%%]'').  
-  - Frekvenční distribuce slovních tvarů lemmatu //dřevo// bez rozlišování velikosti a s nulovým frekvenčním limitem. 
-  - Frekvenční distribuce hodnot strukturních atributů ''txtype'' a ''txtype_group'' lemmatu //dřevo// (bez hodnot s nulovou frekvencí) 
  
-U každého slovního tvaru (atribut [[pojmy:word|word]]) vypsaného ve frekvenční distribuci lemmatu //dřevo// se objevuje několik informací. Základní je informace ve sloupci frekvence, která udává absolutní četnost dané jednotky ve vyhledané konkordanci (byla-li konkordance před zadáním frekvenční distribuce nějak měněna – např. pomocí [[manualy:kontext:filtr|filtrů]] či [[manualy:kontext:konkordance#vzorek|vzorků]] – bude i frekvenční seznam tyto změny reflektovat). V seznamu nalevo od slovního tvaru jsou odkazy **p/n**, které slouží pro rychlé vyvolání pozitivního a negativního [[manualy:kontext:filtr|filtru]]. Kliknutím na **p** v řádku reprezentujícím frekvenci tvaru //dřevem// vyfiltrujeme ze stávající konkordance pouze tento tvar, analogicky po aktivaci **n** budou z aktuální konkordance vyloučeny všechny výskyty daného tvaru.+==== Závislost dvou atributů ====
  
-Poslední sloupec frekvenčního výpisu představuje horizontální sloupcový graf. Ten slouží k rychlé orientaci ve výsledcích -- délka vodorovných čar odpovídá frekvenci slov. 
  
-Při kliknutí na nadpis sloupce se tabulka automaticky podle zvoleného sloupce přetřídíJe tak možné získat i seznam setříděný abecedně (vedle běžného frekvenčně seřazeného výpisu). +Poslední typ frekvenční distribuce odráží vzájemný vztah dvou atributů, a to jak pozičních, tak strukturníchTakto můžeme zjistit například to, jaká jmenná adjektiva (''%%[tag="AC..-.*"]%%'', bez zahrnutí ustrnulých popředložkových tvarů typu //na živo//) jsou typická pro jednotlivé žánry či typy textů (pro SYN2020). V menu **Frekvence → Vlastní** zvolíme možnost **Závislost dvou atributů** a tyto dva atributy vybereme z nabídky, v našem případě jako první atribut (tabulce výsledky se bude zobrazovat v řádcích) zvolíme **lemma**, jako druhý (zobrazovaný ve sloupcích**doc.txtype_group** (pod Typy textů). Rovněž můžeme nastavit minimální hodnotyať už ve [[pojmy:frekvence|frekvenci absolutní či relativní]] anebo percentilech jedné z nich.
- +
-[{{ :manualy:kontext:fqdist-txtype-drevo.png?direct&300|Frekvenční distribuce textových typů a jejich skupin lemmatu //dřevo// }}] +
- +
-Výpis frekvenční distribuce podle **strukturních atributů** má trochu odlišnou strukturu. Stejný zůstává sloupec s absolutní frekvencí a sloupec s **p/n** umožňující rychlé filtrování (v některých případech je znemožněna volba negativního filtru).  +
- +
-Nově se zde u každé položky (hodnoty strukturního atributukterý jsme zvolili) objevuje i položka [[pojmy:ipm|i.p.m.]] Vyjadřuje relativní četnost jevů zobrazených konkordanci vzhledem k celkové velikosti části korpusu s danou hodnotou strukturního atributu. V našem případě se lemma //dřevo// objevuje korpusu [[cnk:syn2015|SYN2015]] četností 2763 oborové literatuř(NFC). Vzhledem k celkovému podílu oborové literatury v korpusu (33 %) to představuje 70,15 výskytů na milion slov (i.p.m.).  +
- +
-Stejně jako u jednotek pozičních je u strukturních atributů možné tabulku přetřídit podle libovolného sloupce; výhodné je to zejména v situacikdy potřebujeme znát pořadí podle relativní četnosti, která umožňuje srovnání počtu výskytů i v nestejně velkých částech korpusu.+
  
 +Po potvrzení volby **Vytvořit frekvenční seznam** se objeví tabulka s počty výskytů jednotlivých adjektiv ve třech [[pojmy:txtype_group|makrotřídách textů]] (tedy v beletrii, oborové literatuře a publicistice), řazenými defaultně podle frekvence sestupně. Zobrazení výsledků je možno podle potřeb dále měnit: střídat absolutní frekvenci s relativní ([[pojmy:ipm|i.p.m.]]) či přepnout orientaci řádků a sloupců, případně namísto tabulky zobrazit seznam dvojic daných atributů. V rámci pokročilých voleb lze mj. třídit řádky podle trojího kritéria (hodnota atributu, součet absolutní/relativní frekvence v řádku či sloupci), nastavit [[pojmy:konfidencni_intervaly|konfidenční interval]] či mapování barev (bližší informace -- viz ikonka otazníku vedle volby **Mapování barev**). Při zobrazení relativních frekvencí (i.p.m.) lze pomocí ikony grafu zobrazit distribuci jevu v řádku nebo ve sloupci pomocí grafu s naznačenými konfidenčními intervaly.
  
 +[{{:manualy:kontext:2d-fqdist.png?direct&450|Výsledek dvoudimenzionální frekvenční distribuce }}]\\
  
 ---- ----
Řádek 89: Řádek 138:
 **[[manualy:kontext:index|Menu]]**: [[manualy:kontext:novy_dotaz|Dotaz]] • [[manualy:kontext:korpusy|Korpusy]] • [[manualy:kontext:ulozit|Uložit]] • [[manualy:kontext:konkordance|Konkordance]] • [[manualy:kontext:filtr|Filtr]] • [[manualy:kontext:frekvence|Frekvence]] • [[[[manualy:kontext:kolokace|Kolokace]] • [[zobrazeni|Zobrazení]] • [[manualy:kontext:napoveda|Nápověda]] **[[manualy:kontext:index|Menu]]**: [[manualy:kontext:novy_dotaz|Dotaz]] • [[manualy:kontext:korpusy|Korpusy]] • [[manualy:kontext:ulozit|Uložit]] • [[manualy:kontext:konkordance|Konkordance]] • [[manualy:kontext:filtr|Filtr]] • [[manualy:kontext:frekvence|Frekvence]] • [[[[manualy:kontext:kolokace|Kolokace]] • [[zobrazeni|Zobrazení]] • [[manualy:kontext:napoveda|Nápověda]]
 </WRAP> </WRAP>
 +