Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
kurz:vyhodnoceni_dotazu [2021/01/06 10:06] – [3. lekce: Položili jsme dotaz. Jak ho vyhodnotit?] michalskrabal | kurz:vyhodnoceni_dotazu [2021/01/07 09:35] – [Vliv typu textu na jazyk] michalskrabal | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== 3. lekce: Položili jsme dotaz. Jak ho vyhodnotit? ====== | ====== 3. lekce: Položili jsme dotaz. Jak ho vyhodnotit? ====== | ||
- | V první lekci tohoto průvodce pro práci s korpusy jsme se naučili pokládat jednoduchý typ dotazu, v druhé lekci jsme si ukázali různé [[zobrazeni_dotazu# | + | V první lekci tohoto průvodce pro práci s korpusy jsme se naučili pokládat jednoduchý typ dotazu, v druhé lekci jsme si ukázali různé [[zobrazeni_dotazu# |
- | + | ||
- | Nyní se zaměříme zejména na to, jak zobrazená data co nejefektivněji vyhodnotit pomocí funkcí **[[manualy: | + | |
===== Frekvence ===== | ===== Frekvence ===== | ||
Řádek 53: | Řádek 51: | ||
==== Vliv typu textu na jazyk ==== | ==== Vliv typu textu na jazyk ==== | ||
- | Pomocí frekvenční distribuce můžeme zkoumat mimo jiné vliv toho, o jaký text se jedná. Vyhledejme výplňkové slovo // | + | Pomocí frekvenční distribuce můžeme zkoumat mimo jiné vliv toho, o jaký text se jedná. Vyhledejme výplňkové slovo // |
Po zobrazení konkordance z menu vybereme **Frekvence → Typy textů**, a protože jednotlivé textové typy a žánry nejsou zastoupeny stejným objemem textů, kliknutím na **i.p.m.** seřadíme výsledky podle relativní frekvence. | Po zobrazení konkordance z menu vybereme **Frekvence → Typy textů**, a protože jednotlivé textové typy a žánry nejsou zastoupeny stejným objemem textů, kliknutím na **i.p.m.** seřadíme výsledky podle relativní frekvence. | ||
Řádek 59: | Řádek 57: | ||
Nejvyšší relativní frekvenci (479 i.p.m.) najdeme u dramat, nejnižší (12 i.p.m.) u administrativních textů. Divadelní hry (txtype SCR: drama) jako druh psaného textu, který má nejblíže mluvenému jazyku, přímo vybízejí ke srovnání s korpusy řady ORAL, které obsahují neformální a nepřipravený mluvený jazyk. Zadáme tedy stejný dotaz, tentokrát do korpusu [[cnk: | Nejvyšší relativní frekvenci (479 i.p.m.) najdeme u dramat, nejnižší (12 i.p.m.) u administrativních textů. Divadelní hry (txtype SCR: drama) jako druh psaného textu, který má nejblíže mluvenému jazyku, přímo vybízejí ke srovnání s korpusy řady ORAL, které obsahují neformální a nepřipravený mluvený jazyk. Zadáme tedy stejný dotaz, tentokrát do korpusu [[cnk: | ||
- | Jelikož ORAL2013 není [[pojmy: | + | Jelikož ORAL2013 není [[pojmy: |
^ Textový typ ^ relativní frekvence ([[pojmy: | ^ Textový typ ^ relativní frekvence ([[pojmy: | ||
Řádek 91: | Řádek 89: | ||
Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční a [[manualy: | Kromě uložení výsledku dotazu (tedy samotných konkordančních řádků) můžeme ukládat i výsledky analýz, především frekvenční a [[manualy: | ||
- | V korpusu SYN2015 najděte všechna slova obsahující segment //krv// (typ dotazu **Část slova**). Pomocí funkce **Frekvence → Lemmata** vytvořte tabulku, která řadí lemmata obsahující v některém ze svých tvarů řetězec znaků //krv// podle frekvence. | + | V korpusu SYN2015 najděte všechna slova obsahující segment //krv// (jednoduchý dotaz s aktivací regulárních výrazů '' |
- | V horní části výsledné tabulky vidíme, že takových lemmat je celkem 129. Nás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež umožní omezit počet exportovaných řádků (od 1 do 38, na řádku | + | V horní části výsledné tabulky vidíme, že takových lemmat je celkem 129. Nás ale budou zajímat jen taková lemmata, která se v daném korpusu vyskytují alespoň desetkrát. Při ukládání zvolte položku **Uložit → Vlastní**, jež umožní omezit počet exportovaných řádků (od 1 do 39, na řádku |
===== Vyzkoušejte si na závěr ===== | ===== Vyzkoušejte si na závěr ===== |