Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
kurz:vyhodnoceni_dotazu [2018/08/16 11:49] – jankocek | kurz:vyhodnoceni_dotazu [2021/01/06 10:06] – [3. lekce: Položili jsme dotaz. Jak ho vyhodnotit?] michalskrabal |
---|
====== 3. lekce: Položili jsme dotaz. Jak ho vyhodnotit? ====== | ====== 3. lekce: Položili jsme dotaz. Jak ho vyhodnotit? ====== |
| |
V první lekci tohoto průvodce pro práci s korpusy jsme se naučili položit [[prvni_dotaz|první dotaz]] a rozlišit, který [[prvni_dotaz#typy_dotazu|typ dotazu]] je vhodný na jaký problém. V druhé lekci jsme si ukázali různé [[zobrazeni_dotazu#moznosti_zobrazeni|možnosti zobrazení výsledků]], především doplňkových informací o zdrojovém textu. | V první lekci tohoto průvodce pro práci s korpusy jsme se naučili pokládat jednoduchý typ dotazu, v druhé lekci jsme si ukázali různé [[zobrazeni_dotazu#moznosti_zobrazeni|možnosti zobrazení výsledků]], především doplňkových informací o zdrojovém textu. |
| |
V této, třetí lekci se zaměříme zejména na to, jak zobrazená data co nejefektivněji vyhodnotit pomocí funkcí **[[manualy:kontext:frekvence|Frekvence]]** a **[[manualy:kontext:konkordance#trideni|Konkordance → Třídění řádků]]**. | Nyní se zaměříme zejména na to, jak zobrazená data co nejefektivněji vyhodnotit pomocí funkcí **[[manualy:kontext:frekvence|Frekvence]]** a **[[manualy:kontext:konkordance#trideni|Konkordance → Třídění řádků]]**. |
| |
===== Frekvence ===== | ===== Frekvence ===== |
Zkusme si nejprve společně vyhledat frekvenci jednotlivých pádových forem [[pojmy:lemma|lemmatu]] //noha//. V korpusu [[cnk:syn2010|SYN2010]] se jich nachází 29 990. V menu zvolíme volbu **Frekvence → Slovní tvary**, načež se nám ukážou všechny [[pojmy:word|slovní tvary]] (včetně všech rozdílů v psaní velkých a malých písmen). Celkový počet různých forem ([[pojmy:typ|typů]]) je zobrazen za slovem **Celkem** v horní části výsledné tabulky. | Zkusme si nejprve společně vyhledat frekvenci jednotlivých pádových forem [[pojmy:lemma|lemmatu]] //noha//. V korpusu [[cnk:syn2010|SYN2010]] se jich nachází 29 990. V menu zvolíme volbu **Frekvence → Slovní tvary**, načež se nám ukážou všechny [[pojmy:word|slovní tvary]] (včetně všech rozdílů v psaní velkých a malých písmen). Celkový počet různých forem ([[pojmy:typ|typů]]) je zobrazen za slovem **Celkem** v horní části výsledné tabulky. |
| |
[{{ :kurz:lemma_slovni_tvary_bezvelkych.png?500|Frekvenční distribuce slovních tvarů ([[pojmy:case-sensitive|case-insensitive]] FIXME)}}] | [{{ :kurz:lemma_slovni_tvary_bezvelkych.png?500|Frekvenční distribuce slovních tvarů ([[pojmy:case-sensitive|case-insensitive]] )}}] |
| |
Připadá-li nám tabulka nepřehledná, můžeme ji snadno upravit: stačí v menu vybrat volbu **Frekvence → Vlastní**, zvolit atribut **word** a zaškrtnout, že nechceme [[pojmy:case-sensitive|rozlišovat velikost]]. Z výsledné tabulky snadno vyčteme, kolikrát se slovo //noha// realizuje v "neživotném" tvaru //nohami//. Pokud vás zajímá, zda a jak se liší užití tvarů //nohama// a //nohami//, stačí prokliknout přes modře zvýrazněné <fc #4169e1>p</fc> vlevo od vybraného tvaru (<fc #4169e1>p</fc> značí pozitivní [[manualy:kontext:filtr|filtr]] dané konkordance, <fc #4169e1>n</fc> je filtr negativní a zobrazil by všechny tvary **kromě** vybraného). | Připadá-li nám tabulka nepřehledná, můžeme ji snadno upravit: stačí v menu vybrat volbu **Frekvence → Vlastní**, zvolit atribut **word** a zaškrtnout, že nechceme [[pojmy:case-sensitive|rozlišovat velikost]]. Z výsledné tabulky snadno vyčteme, kolikrát se slovo //noha// realizuje v "neživotném" tvaru //nohami//. Pokud vás zajímá, zda a jak se liší užití tvarů //nohama// a //nohami//, stačí prokliknout přes modře zvýrazněné <fc #4169e1>p</fc> vlevo od vybraného tvaru (<fc #4169e1>p</fc> značí pozitivní [[manualy:kontext:filtr|filtr]] dané konkordance, <fc #4169e1>n</fc> je filtr negativní a zobrazil by všechny tvary **kromě** vybraného). |
Stejně jako si můžeme nechat korpusovým manažerem sečíst totožné tvary, není problém aplikovat početní operace i na jiné atributy, např. //[[pojmy:tag|tag]]//. | Stejně jako si můžeme nechat korpusovým manažerem sečíst totožné tvary, není problém aplikovat početní operace i na jiné atributy, např. //[[pojmy:tag|tag]]//. |
| |
[{{:kurz:frekvdistribtag.png?600 | Výběr vlastního atributu pro frekvenční distribuci FIXME}}] | [{{:kurz:frekvdistribtag.png?600 | Výběr vlastního atributu pro frekvenční distribuci }}] |
| |
==== Frekvenční distribuce slovních druhů v okolí KWICu ==== | ==== Frekvenční distribuce slovních druhů v okolí KWICu ==== |
| |
| |
[{{:kurz:frekvdistr_tag1l.png?500| Zadání frekvenční distribuce na první pozici vlevo vedle KWICu FIXME}}] | [{{:kurz:frekvdistr_tag1l.png?500| Zadání frekvenční distribuce na první pozici vlevo vedle KWICu }}] |
| |
<WRAP clear/> | <WRAP clear/> |
Charakteristiky mluvčích v mluvených korpusech ([[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|věk, pohlaví, vzdělání, oblast]]), to vše si navolíte prostřednictvím volby **Frekvence → Vlastní → Podle typů textu**. Podobný výstup poskytuje i rychlá volba **Frekvence → Typy textů**, kterou aplikujete na konkordanci v mluveném korpusu řady Oral. | Charakteristiky mluvčích v mluvených korpusech ([[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|věk, pohlaví, vzdělání, oblast]]), to vše si navolíte prostřednictvím volby **Frekvence → Vlastní → Podle typů textu**. Podobný výstup poskytuje i rychlá volba **Frekvence → Typy textů**, kterou aplikujete na konkordanci v mluveném korpusu řady Oral. |
| |
[{{:kurz:vlastne_oral_frekdis.png?500|Frekvenční distribuce sociolingvistických proměnných FIXME}}] | [{{:kurz:vlastne_oral_frekdis.png?500|Frekvenční distribuce sociolingvistických proměnných }}] |
| |
<WRAP clear/> | <WRAP clear/> |