Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
kurz:vyhodnoceni_dotazu [2018/08/21 14:28] – jankocek | kurz:vyhodnoceni_dotazu [2021/01/07 09:35] – [Vliv typu textu na jazyk] michalskrabal | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== 3. lekce: Položili jsme dotaz. Jak ho vyhodnotit? ====== | ====== 3. lekce: Položili jsme dotaz. Jak ho vyhodnotit? ====== | ||
- | V první lekci tohoto průvodce pro práci s korpusy jsme se naučili | + | V první lekci tohoto průvodce pro práci s korpusy jsme se naučili |
- | + | ||
- | V této, třetí lekci se zaměříme zejména na to, jak zobrazená data co nejefektivněji vyhodnotit pomocí funkcí **[[manualy: | + | |
===== Frekvence ===== | ===== Frekvence ===== | ||
Řádek 30: | Řádek 28: | ||
Stejně jako si můžeme nechat korpusovým manažerem sečíst totožné tvary, není problém aplikovat početní operace i na jiné atributy, např. // | Stejně jako si můžeme nechat korpusovým manažerem sečíst totožné tvary, není problém aplikovat početní operace i na jiné atributy, např. // | ||
- | [{{: | + | [{{: |
==== Frekvenční distribuce slovních druhů v okolí KWICu ==== | ==== Frekvenční distribuce slovních druhů v okolí KWICu ==== | ||
Řádek 37: | Řádek 35: | ||
- | [{{: | + | [{{: |
<WRAP clear/> | <WRAP clear/> | ||
Řádek 53: | Řádek 51: | ||
==== Vliv typu textu na jazyk ==== | ==== Vliv typu textu na jazyk ==== | ||
- | Pomocí frekvenční distribuce můžeme zkoumat mimo jiné vliv toho, o jaký text se jedná. Vyhledejme výplňkové slovo // | + | Pomocí frekvenční distribuce můžeme zkoumat mimo jiné vliv toho, o jaký text se jedná. Vyhledejme výplňkové slovo // |
Po zobrazení konkordance z menu vybereme **Frekvence → Typy textů**, a protože jednotlivé textové typy a žánry nejsou zastoupeny stejným objemem textů, kliknutím na **i.p.m.** seřadíme výsledky podle relativní frekvence. | Po zobrazení konkordance z menu vybereme **Frekvence → Typy textů**, a protože jednotlivé textové typy a žánry nejsou zastoupeny stejným objemem textů, kliknutím na **i.p.m.** seřadíme výsledky podle relativní frekvence. | ||
Řádek 59: | Řádek 57: | ||
Nejvyšší relativní frekvenci (479 i.p.m.) najdeme u dramat, nejnižší (12 i.p.m.) u administrativních textů. Divadelní hry (txtype SCR: drama) jako druh psaného textu, který má nejblíže mluvenému jazyku, přímo vybízejí ke srovnání s korpusy řady ORAL, které obsahují neformální a nepřipravený mluvený jazyk. Zadáme tedy stejný dotaz, tentokrát do korpusu [[cnk: | Nejvyšší relativní frekvenci (479 i.p.m.) najdeme u dramat, nejnižší (12 i.p.m.) u administrativních textů. Divadelní hry (txtype SCR: drama) jako druh psaného textu, který má nejblíže mluvenému jazyku, přímo vybízejí ke srovnání s korpusy řady ORAL, které obsahují neformální a nepřipravený mluvený jazyk. Zadáme tedy stejný dotaz, tentokrát do korpusu [[cnk: | ||
- | Jelikož ORAL2013 není [[pojmy: | + | Jelikož ORAL2013 není [[pojmy: |
^ Textový typ ^ relativní frekvence ([[pojmy: | ^ Textový typ ^ relativní frekvence ([[pojmy: | ||
Řádek 75: | Řádek 73: | ||
Charakteristiky mluvčích v mluvených korpusech ([[pojmy: | Charakteristiky mluvčích v mluvených korpusech ([[pojmy: | ||
- | [{{: | + | [{{: |
<WRAP clear/> | <WRAP clear/> | ||
Řádek 91: | Řádek 89: | ||
Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční a [[manualy: | Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční a [[manualy: | ||
- | V korpusu SYN2015 najděte všechna slova obsahující segment //krv// (typ dotazu **Část slova**). Pomocí funkce **Frekvence → Lemmata** vytvořte tabulku, která řadí lemmata obsahující v některém ze svých tvarů řetězec znaků //krv// podle frekvence. | + | V korpusu SYN2015 najděte všechna slova obsahující segment //krv// (jednoduchý dotaz s aktivací regulárních výrazů '' |
- | V horní části výsledné tabulky vidíme, že takových lemmat je celkem 129. Nás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež umožní omezit počet exportovaných řádků (od 1 do 38, na řádku | + | V horní části výsledné tabulky vidíme, že takových lemmat je celkem 129. Nás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež umožní omezit počet exportovaných řádků (od 1 do 39, na řádku |
===== Vyzkoušejte si na závěr ===== | ===== Vyzkoušejte si na závěr ===== |