AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Poslední revizeObě strany příští revize
manualy:kontext:frekvencni_distribuce [2017/04/12 11:36] – [Vlastní nastavení frekvenční distribuce] luciechlumskamanualy:kontext:frekvencni_distribuce [2018/08/03 15:27] – [Frekvenční seznam (výpis)] vaclavcvrcek
Řádek 12: Řádek 12:
 ===== Vlastní nastavení frekvenční distribuce ===== ===== Vlastní nastavení frekvenční distribuce =====
  
-Formulář, který se zobrazí po kliknutí na volbu **Frekvenční distribuce → Vlastní** má dvě možnosti:+Formulář, který se zobrazí po kliknutí na volbu **Frekvenční distribuce → Vlastní**má tři možnosti:
  
-  - běžnou frekvenční distribuci (slouží k analýze [[pojmy:atributy_pozicni|pozičních atributů]], jako je word, lemma, tag apod., buď v rámci KWICu nebo v jeho okolí pomocí přidání dalších úrovní)+  - běžnou frekvenční distribuci (slouží k analýze [[pojmy:atributy_pozicni|pozičních atributů]], jako je word, lemma, tag apod., v rámci KWICu nebo v jeho okolí pomocí přidání dalších úrovní)
   - frekvenční distribuci podle typů textu neboli [[pojmy:atributy_strukturni|strukturních atributů]] (jako je ''[[pojmy:txtype|txtype]]'', ''[[pojmy:medium|med]]'' nebo ''[[pojmy:srclang|srclang]]'')   - frekvenční distribuci podle typů textu neboli [[pojmy:atributy_strukturni|strukturních atributů]] (jako je ''[[pojmy:txtype|txtype]]'', ''[[pojmy:medium|med]]'' nebo ''[[pojmy:srclang|srclang]]'')
 +  - frekvenční distribuci odrážející vzájemný vztah dvou atributů (pozičních i strukturních)
  
-[{{ :manualy:kontext:fqdist-pozice.png?direct&300|Formulář pro běžnou frekvenční distribuci ([[pojmy:atributy_pozicni|poziční atributy]]) }}]+[{{ :manualy:kontext:fqdist-pozice.png?direct&300|Formulář pro víceúrovňovou frekvenční distribuci ([[pojmy:atributy_pozicni|poziční atributy]]) }}]
  
-==== Víceúrovňová frekvenční distribuce ====+==== Běžná frekvenční distribuce ====
  
-Víceúrovňová frekvenční distribuce umožňuje počítat frekvenční distribuci na libovolné pozici konkordance v rozmezí 6 pozic nalevo až 6 pozic napravo od [[pojmy:kwic|KWICu]]. Ve formuláři je nejprve třeba zvolit, jaký **atribut** chceme ve frekvenční distribuci počítat (např. v korpusech [[cnk:syn|řady SYN]] jsou k dispozici základní [[pojmy:atributy_pozicni|poziční atributy]] ''word'', ''lemma'', ''tag'', ''lc'', ''pos'', dále pak specifické atributy ''k'', ''g'', ''c''). +Běžná frekvenční distribuce umožňuje počítat frekvenční distribuci na libovolné pozici konkordance v rozmezí 6 pozic nalevo až 6 pozic napravo od [[pojmy:kwic|KWICu]]. Ve formuláři je nejprve třeba zvolit, jaký **atribut** chceme ve frekvenční distribuci počítat (např. v korpusech [[cnk:syn|řady SYN]] jsou k dispozici základní [[pojmy:atributy_pozicni|poziční atributy]] ''word'', ''lemma'', ''tag'', ''lc'', ''pos'', dále pak specifické atributy ''k'', ''g'', ''c''). 
  
 Dále je třeba zvolit, zda se frekvenční distribuce má počítat s ohledem na velikost písmen. Při volbě [[pojmy:case-insensitive|case-insensitive]] jsou všechny položky převedeny na malá písmena bez ohledu na to, s jakou velikostí písmen se reálně v korpusu objevují. Dále je třeba zvolit, zda se frekvenční distribuce má počítat s ohledem na velikost písmen. Při volbě [[pojmy:case-insensitive|case-insensitive]] jsou všechny položky převedeny na malá písmena bez ohledu na to, s jakou velikostí písmen se reálně v korpusu objevují.
 +
 +[{{ :manualy:kontext:fqdist-reference.png?direct&300|Formulář pro frekvenční distribuci typů textů}}]
  
 Při vlastním nastavení frekvenční distribuce se nemusíme omezovat pouze na KWIC (jako je tomu v případě rychlých voleb). Může být počítána z kterékoli kontextové pozice v pravém nebo levém okolí od hledaného slova. Položka //pozice// ve formuláři umožňuje vybrat jak pozice v levém (předcházejícím) kontextu (6L--1L), samotný KWIC, tak pozice v pravém (následujícím) kontextu (1R--6R). Číslování pozic (podle současné i starší notace) shrnuje následující tabulka: Při vlastním nastavení frekvenční distribuce se nemusíme omezovat pouze na KWIC (jako je tomu v případě rychlých voleb). Může být počítána z kterékoli kontextové pozice v pravém nebo levém okolí od hledaného slova. Položka //pozice// ve formuláři umožňuje vybrat jak pozice v levém (předcházejícím) kontextu (6L--1L), samotný KWIC, tak pozice v pravém (následujícím) kontextu (1R--6R). Číslování pozic (podle současné i starší notace) shrnuje následující tabulka:
Řádek 38: Řádek 41:
  
 Pokud chceme vytvořit frekvenční distribuci nikoli pouze jednotek, ale například dvojic slov ([[pojmy:bigram|bigramů]]) nebo rozsáhlejších celků, musíme přidat další úroveň frekvenční distribuce. Ve formuláři přibude další řádek se shodnými možnostmi nastavení. Jednodušší variantu představuje rychlá volba frekvenční distribuce nazvaná **Slovní tvary** - pokud ji aplikujeme na víceslovný KWIC (např. po vyhledání dvou po sobě jdoucích adverbií typu //pomalu a opatrně// [''tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>][word=<nowiki>"</nowiki>a<nowiki>"</nowiki>][tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>]''), ukáže nám vyhledané víceslovné výrazy seřazené podle frekvence bez složitého nastavování. Pokud chceme vytvořit frekvenční distribuci nikoli pouze jednotek, ale například dvojic slov ([[pojmy:bigram|bigramů]]) nebo rozsáhlejších celků, musíme přidat další úroveň frekvenční distribuce. Ve formuláři přibude další řádek se shodnými možnostmi nastavení. Jednodušší variantu představuje rychlá volba frekvenční distribuce nazvaná **Slovní tvary** - pokud ji aplikujeme na víceslovný KWIC (např. po vyhledání dvou po sobě jdoucích adverbií typu //pomalu a opatrně// [''tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>][word=<nowiki>"</nowiki>a<nowiki>"</nowiki>][tag=<nowiki>"</nowiki>D.*<nowiki>"</nowiki>]''), ukáže nám vyhledané víceslovné výrazy seřazené podle frekvence bez složitého nastavování.
- 
-[{{ :manualy:kontext:fqdist-reference.png?direct&300|Formulář pro víceúrovňovou frekvenční distribuci FIXME }}] 
  
 V případě, že jsme se specifikací spokojeni, spustíme výpočet kliknutím na tlačítko **Vytvořit frekvenční seznam**. V základním nastavení se ve výsledku zobrazí všechny položky s alespoň jednotkovým výskytem. Chceme-li výpis zúžit, můžeme nastavit **Frekvenční limit** na hodnotu, která vyhovuje konkrétní situaci. V případě, že jsme se specifikací spokojeni, spustíme výpočet kliknutím na tlačítko **Vytvořit frekvenční seznam**. V základním nastavení se ve výsledku zobrazí všechny položky s alespoň jednotkovým výskytem. Chceme-li výpis zúžit, můžeme nastavit **Frekvenční limit** na hodnotu, která vyhovuje konkrétní situaci.
Řádek 50: Řádek 51:
  
 I zde můžeme nastavit frekvenční limit, chceme-li omezit počet výsledků v seznamu. Zároveň je ale možné pomocí volby **Zahrnout i kategorie bez výskytů** zobrazit v seznamu ty hodnoty atributů, které se v konkordanci vůbec neobjevily. Lemma //dřevo// se např. ani jednou neobjevuje v písních (txtype [[seznamy:txtype|SON]]). Je-li tato volba zaškrtnuta, txtype SON se ve frekvenční distribuci přesto objeví, a to s nulovou frekvencí. I zde můžeme nastavit frekvenční limit, chceme-li omezit počet výsledků v seznamu. Zároveň je ale možné pomocí volby **Zahrnout i kategorie bez výskytů** zobrazit v seznamu ty hodnoty atributů, které se v konkordanci vůbec neobjevily. Lemma //dřevo// se např. ani jednou neobjevuje v písních (txtype [[seznamy:txtype|SON]]). Je-li tato volba zaškrtnuta, txtype SON se ve frekvenční distribuci přesto objeví, a to s nulovou frekvencí.
 +
 +==== Závislost dvou atributů ====
 +
 +[{{ :manualy:kontext:2d-fqdist.png?nolink&450|Výsledek dvoudimenzionální frekvenční distribuce}}] 
 +
 +Poslední typ frekvenční distribuce odráží vzájemný vztah dvou atributů, a to jak pozičních, tak strukturních. Takto můžeme zjistit například to, jaká jmenná adjektiva (''%%[tag="AC.*"]%%'') jsou typická pro jednotlivé žánry či typy textů. V menu **Frekvenční distribuce** zvolíme volbu **Závislost dvou atributů** a tyto dva atributy vybereme z nabídky, v našem případě jako první atribut (v tabulce s výsledky se bude zobrazovat v řádcích) zvolíme **lemma**, jako druhý (zobrazovaný ve sloupcích) **doc.txtype_group** (pod Typy textů). Rovněž můžeme nastavit minimální hodnoty, ať už ve [[pojmy:frekvence|frekvenci absolutní či relativní]] anebo v percentilech jedné z nich.
 +
 +Po potvrzení volby **Vytvořit frekvenční seznam** se objeví tabulka s počty výskytů jednotlivých adjektiv ve třech [[pojmy:txtype_group|makrotřídách textů]] (tedy v beletrii, oborové literatuře a publicistice), řazenými defaultně podle frekvence sestupně. Zobrazení výsledků je možno podle potřeb dále měnit: střídat absolutní frekvenci s relativní ([[pojmy:ipm|i.p.m.]]) či přepnout orientaci řádků a sloupců, případně namísto tabulky zobrazit seznam dvojic daných atributů. V rámci pokročilých voleb lze mj. třídit řádky podle trojího kritéria (hodnota atributu, součet absolutní/relativní frekvence v řádku či sloupci), nastavit [[kurz:konfidencni_intervaly|konfidenční interval]] či mapování barev (bližší informace -- viz ikonka otazníku vedle volby **Mapování barev**). Při zobrazení relativních frekvencí (i.p.m.) lze pomocí ikony grafu zobrazit distribuci jevu v řádku nebo ve sloupci pomocí grafu s naznačenými konfidenčními intervaly.
 +
 ===== Frekvenční seznam (výpis) ===== ===== Frekvenční seznam (výpis) =====
  
Řádek 77: Řádek 87:
  
 <WRAP center round box 48%> <WRAP center round box 48%>
-**[[manualy:kontext:index|Menu]]**: [[manualy:kontext:novy_dotaz|Dotaz]] • [[manualy:kontext:subkorpus|Korpusy]] • [[manualy:kontext:ulozit|Uložit]] • [[manualy:kontext:konkordance|Konkordance]] • [[manualy:kontext:filtr|Filtr]] • [[manualy:kontext:frekvencni_distribuce|Frekvence]] • [[[[manualy:kontext:kolokace|Kolokace]] • [[moznosti_zobrazeni|Zobrazení]] • [[manualy:kontext:napoveda|Nápověda]]+**[[manualy:kontext:index|Menu]]**: [[manualy:kontext:novy_dotaz|Dotaz]] • [[manualy:kontext:korpusy|Korpusy]] • [[manualy:kontext:ulozit|Uložit]] • [[manualy:kontext:konkordance|Konkordance]] • [[manualy:kontext:filtr|Filtr]] • [[manualy:kontext:frekvencni_distribuce|Frekvence]] • [[[[manualy:kontext:kolokace|Kolokace]] • [[zobrazeni|Zobrazení]] • [[manualy:kontext:napoveda|Nápověda]]
 </WRAP> </WRAP>