AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
kurz:vyhodnoceni_dotazu [2018/08/06 16:49] – [Třídění řádků] michalskrabalkurz:vyhodnoceni_dotazu [2018/08/29 11:15] jankocek
Řádek 13: Řádek 13:
 ==== Frekvenční distribuce slovních tvarů ==== ==== Frekvenční distribuce slovních tvarů ====
  
-[{{:kurz:frekv_slovnitvary.png?400|Frekvenční distribuce slovních tvarů (s [[pojmy:case-sensitive|rozlišováním velikosti]] FIXME)}}] +[{{:kurz:frekv_slovnitvary.png?400|Frekvenční distribuce slovních tvarů (s [[pojmy:case-sensitive|rozlišováním velikosti]] )}}] 
  
 Zkusme si nejprve společně vyhledat frekvenci jednotlivých pádových forem [[pojmy:lemma|lemmatu]] //noha//. V korpusu [[cnk:syn2010|SYN2010]] se jich nachází 29 990. V menu zvolíme volbu **Frekvence → Slovní tvary**, načež se nám ukážou všechny [[pojmy:word|slovní tvary]] (včetně všech rozdílů v psaní velkých a malých písmen). Celkový počet různých forem ([[pojmy:typ|typů]]) je zobrazen za slovem **Celkem** v horní části výsledné tabulky. Zkusme si nejprve společně vyhledat frekvenci jednotlivých pádových forem [[pojmy:lemma|lemmatu]] //noha//. V korpusu [[cnk:syn2010|SYN2010]] se jich nachází 29 990. V menu zvolíme volbu **Frekvence → Slovní tvary**, načež se nám ukážou všechny [[pojmy:word|slovní tvary]] (včetně všech rozdílů v psaní velkých a malých písmen). Celkový počet různých forem ([[pojmy:typ|typů]]) je zobrazen za slovem **Celkem** v horní části výsledné tabulky.
  
-[{{ :kurz:lemma_slovni_tvary_bezvelkych.png?500|Frekvenční distribuce slovních tvarů ([[pojmy:case-sensitive|case-insensitive]] FIXME)}}]+[{{ :kurz:lemma_slovni_tvary_bezvelkych.png?500|Frekvenční distribuce slovních tvarů ([[pojmy:case-sensitive|case-insensitive]] )}}]
  
 Připadá-li nám tabulka nepřehledná, můžeme ji snadno upravit: stačí v menu vybrat volbu **Frekvence → Vlastní**, zvolit atribut **word** a zaškrtnout, že nechceme [[pojmy:case-sensitive|rozlišovat velikost]]. Z výsledné tabulky snadno vyčteme, kolikrát se slovo //noha// realizuje v "neživotném" tvaru //nohami//. Pokud vás zajímá, zda a jak se liší užití tvarů //nohama// a //nohami//, stačí prokliknout přes modře zvýrazněné <fc #4169e1>p</fc> vlevo od vybraného tvaru (<fc #4169e1>p</fc> značí pozitivní [[manualy:kontext:filtr|filtr]] dané konkordance, <fc #4169e1>n</fc> je filtr negativní a zobrazil by všechny tvary **kromě** vybraného).  Připadá-li nám tabulka nepřehledná, můžeme ji snadno upravit: stačí v menu vybrat volbu **Frekvence → Vlastní**, zvolit atribut **word** a zaškrtnout, že nechceme [[pojmy:case-sensitive|rozlišovat velikost]]. Z výsledné tabulky snadno vyčteme, kolikrát se slovo //noha// realizuje v "neživotném" tvaru //nohami//. Pokud vás zajímá, zda a jak se liší užití tvarů //nohama// a //nohami//, stačí prokliknout přes modře zvýrazněné <fc #4169e1>p</fc> vlevo od vybraného tvaru (<fc #4169e1>p</fc> značí pozitivní [[manualy:kontext:filtr|filtr]] dané konkordance, <fc #4169e1>n</fc> je filtr negativní a zobrazil by všechny tvary **kromě** vybraného). 
Řádek 30: Řádek 30:
 Stejně jako si můžeme nechat korpusovým manažerem sečíst totožné tvary, není problém aplikovat početní operace i na jiné atributy, např. //[[pojmy:tag|tag]]//. Stejně jako si můžeme nechat korpusovým manažerem sečíst totožné tvary, není problém aplikovat početní operace i na jiné atributy, např. //[[pojmy:tag|tag]]//.
  
-[{{:kurz:frekvdistribtag.png?600 | Výběr vlastního atributu pro frekvenční distribuci FIXME}}]+[{{:kurz:frekvdistribtag.png?600 | Výběr vlastního atributu pro frekvenční distribuci }}]
  
 ==== Frekvenční distribuce slovních druhů v okolí KWICu ==== ==== Frekvenční distribuce slovních druhů v okolí KWICu ====
Řádek 37: Řádek 37:
  
  
-[{{:kurz:frekvdistr_tag1l.png?500| Zadání frekvenční distribuce na první pozici vlevo vedle KWICu FIXME}}]+[{{:kurz:frekvdistr_tag1l.png?500| Zadání frekvenční distribuce na první pozici vlevo vedle KWICu }}]
  
 <WRAP clear/> <WRAP clear/>
Řádek 75: Řádek 75:
 Charakteristiky mluvčích v mluvených korpusech ([[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|věk, pohlaví, vzdělání, oblast]]), to vše si navolíte prostřednictvím volby **Frekvence → Vlastní → Podle typů textu**. Podobný výstup poskytuje i rychlá volba **Frekvence → Typy textů**, kterou aplikujete na konkordanci v mluveném korpusu řady Oral. Charakteristiky mluvčích v mluvených korpusech ([[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|věk, pohlaví, vzdělání, oblast]]), to vše si navolíte prostřednictvím volby **Frekvence → Vlastní → Podle typů textu**. Podobný výstup poskytuje i rychlá volba **Frekvence → Typy textů**, kterou aplikujete na konkordanci v mluveném korpusu řady Oral.
  
-[{{:kurz:vlastne_oral_frekdis.png?500|Frekvenční distribuce sociolingvistických proměnných FIXME}}]+[{{:kurz:vlastne_oral_frekdis.png?500|Frekvenční distribuce sociolingvistických proměnných }}]
  
 <WRAP clear/> <WRAP clear/>
Řádek 89: Řádek 89:
 ===== Uložení výsledků analýzy ===== ===== Uložení výsledků analýzy =====
  
-Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční distribuce či [[manualy:kontext:kolokace|kolokační]] analýzy. Ve výsledné tabulce (pokud data otevíráme v tabulkovém editoru) můžeme dále třídit, promazávat či jinak upravovat řádky podle svých představ a výzkumných záměrů. +Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční [[manualy:kontext:kolokace|kolokační]] seznamy. Ve výsledné tabulce (pokud data otevíráme v tabulkovém editoru) můžeme dále třídit, promazávat či jinak upravovat řádky podle svých představ a výzkumných záměrů. 
  
-V korpusu SYN2010 najděte všechna slova obsahující segment //krv// (typ dotazu **Část slova**). Pomocí funkce **Frekvence → Lemmata** vytvořte tabulku, která řadí lemmata obsahující v některém ze svých tvarů řetězec znaků //krv// podle frekvence. +V korpusu SYN2015 najděte všechna slova obsahující segment //krv// (typ dotazu **Část slova**). Pomocí funkce **Frekvence → Lemmata** vytvořte tabulku, která řadí lemmata obsahující v některém ze svých tvarů řetězec znaků //krv// podle frekvence. 
  
-V horní části výsledné tabulky vidíte, že takových lemmat je celkem 138Vás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež vám umožní omezit počet exportovaných řádků (od 1 do 39, na řádku 40 je slovo, které je v korpusu SYN2010 pouze devětkrát). Zvolte formát XLSX a data uložte. V okně, které se vám automaticky zobrazí, stačí už jen zvolit, zda chcete soubor otevřít ve formátu Excel (pozor, v tom případě není zatím uložený!), nebo ho rovnou uložit mezi své soubory.+V horní části výsledné tabulky vidíme, že takových lemmat je celkem 129Nás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež umožní omezit počet exportovaných řádků (od 1 do 38, na řádku 39 je slovo, které je v korpusu SYN2015 pouze devětkrát). Zvolte formát XLSX a data uložte. V okně, které se automaticky zobrazí, stačí už jen zvolit, zda chcete soubor otevřít ve formátu Excel (pozor, v tom případě není zatím uložený!), nebo ho rovnou uložit mezi své soubory.
  
 ===== Vyzkoušejte si na závěr ===== ===== Vyzkoušejte si na závěr =====