Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
manualy:wag [2020/09/19 09:52] – [WaG: Slovo v kostce] michalskrabal | manualy:wag [2021/02/18 11:58] – [Přehled jednotlivých prvků] paralelní hledání adrianzasina | ||
---|---|---|---|
Řádek 3: | Řádek 3: | ||
{{ : | {{ : | ||
- | Aplikace Slovo v kostce (Word at a Glance, WaG) slouží k vytvoření základního přehledu o tom, jak se používá zadané slovo či sousloví. Soustředí v sobě informace, které lze získat z [[cnk: | + | Aplikace |
Aktuálně je WaG implementován pouze pro české zdroje a obsahuje tři základní moduly: | Aktuálně je WaG implementován pouze pro české zdroje a obsahuje tři základní moduly: | ||
Řádek 11: | Řádek 11: | ||
* informace o možných překladech zadaného slova do jiných jazyků (modul //Hledat ve dvou jazycích// | * informace o možných překladech zadaného slova do jiných jazyků (modul //Hledat ve dvou jazycích// | ||
- | Výsledky analýzy zadaného slova jsou v aplikaci uspořádány do dlaždic. Každá dlaždice obsahuje informaci o tom, z jakého zdroje údaje pocházejí, | + | Výsledky analýzy zadaného slova jsou v aplikaci uspořádány do dlaždic. Každá dlaždice obsahuje informaci o tom, z jakého zdroje údaje pocházejí, |
- | Pro každou dlaždici je v záhlaví k dispozici stručná nápověda, která poskytuje dodatečné informace o zdrojích dat a o možnostech interpretace výsledků. V některých | + | Všechny prezentované údaje jsou získány automatickou analýzou -- přesnost a věrohodnost frekvenčních informací závisí na tom, jak spolehlivá je [[pojmy: |
- | *Přehled jednotlivých dlaždic:* | + | Aplikace je dostupná na adrese: |
- | Všechny prezentované údaje jsou získány automatickou analýzou – přesnost a věrohodnost frekvenčních informací závisí na tom, jak spolehlivá je [[pojmy: | + | ===== Přehled jednotlivých prvků ===== |
- | Aplikace | + | === Frekvenční informace === |
+ | |||
+ | == Lemma == | ||
+ | |||
+ | ukazuje, jak jsme zadané slovo interpretovali. Pokud jste zadali slovo v jiném než základním tvaru (například // | ||
+ | |||
+ | == Slovní druh == | ||
+ | |||
+ | Zadané slovo bylo námi určitým způsobem interpretováno a přiřazeno k určitému slovnímu druhu. Výsledek | ||
+ | |||
+ | == Frekvenční pásmo == | ||
+ | |||
+ | názorně ukazuje, jak frekventované dané slovo je, tj. jak často ho najdete v českých // | ||
+ | |||
+ | == Kolikrát v milionu slov == | ||
+ | |||
+ | Údaj podobně jako frekvenční pásmo (nebo [[pojmy:ipm|ipm]]) ukazuje, jak často se s daným slovem setkáte -- zde v přepočtu na korpus o velikosti 1 milion slov. Například hodnota 10 000 znamená, že přibližně každé sté slovo v českých textech bude vámi hledaný výraz, tedy že ho najdete na jedné stránce třeba i několikrát. Hodnota 1 znamená, že se zadané slovo vyskytuje průměrně v milionu slov jen jednou , tzn. že byste museli přečíst třeba i několik tlustých románů, než byste na něj vůbec narazili. (Pro představu, jedno z nejčastějších českých slov //že// má hodnotu ipm 7923, na druhou stranu slovo // | ||
+ | |||
+ | == Slova s podobně častým výskytem == | ||
+ | |||
+ | je seznam výrazů, které najdete v textech přibližně stejně často jako vámi hledané slovo. Tento výčet není úplný, jde pouze o náhodný výběr z podobně frekventovaných slov. | ||
+ | |||
+ | == Slovní tvary == | ||
+ | |||
+ | Vyhledány jsou všechny tvary zadaného slova. Pokud jste tedy do vyhledávacího políčka napsali | ||
+ | |||
+ | Pomocí ikonky v pravém horním rohu si lze dlaždici přepnout do režimu tabulky. Tak se můžete podívat nejenom na relativní četnost (procentuální zastoupení) jednotlivých tvarů, ale i na absolutní počet, tedy kolikrát jsme daný slovní tvar našli v korpusu [[cnk: | ||
+ | |||
+ | == Frekvence podle typu textu == | ||
+ | |||
+ | Z grafu je patrné, v jakém [[pojmy: | ||
+ | |||
+ | Tip: Pro srovnání si můžete vyhledat slova, která se typicky vyskytují v jednom z typů textů, např.: | ||
+ | |||
+ | === Psaný jazyk === | ||
+ | |||
+ | ==Kolokace== | ||
+ | |||
+ | [[pojmy: | ||
+ | |||
+ | Kliknutím na ikonku nastavení můžete omezit prohledávaný kontext pouze na levou, či pravou stranu. Najetím kurzoru na konkrétní slovo se podbarví odpovídající příkladová věta v dlaždici vpravo. (Pozor! Kolokace může překračovat hranici věty, a kolokát se tudíž nemusí v příkladové větě objevit.) | ||
+ | |||
+ | Příklady použití kolokací v autentických psaných textech vidíte na vedlejší dlaždici | ||
+ | |||
+ | ==Frekvence výskytu slova v čase== | ||
+ | |||
+ | Graf naznačuje trend v užívání slova za poslední dvě desetiletí, | ||
+ | |||
+ | Tloušťka čáry v grafu se odvozuje od tzv. konfidenčního intervalu, který udává, jak spolehlivá data pro výzkum zadaného jevu máme. Čím je čára tlustší, tím méně spolehlivá data pro identifikaci daného trendu máme. | ||
+ | |||
+ | Kliknutím | ||
+ | |||
+ | ==Podobně používaná slova== | ||
+ | |||
+ | Dlaždice ukazuje slova, která jsou kontextově podobná slovu zadanému. Vzhledem k tomu, že kontext slova lze chápat jako věrné zrcadlo jeho funkce a významu, můžeme předpokládat, | ||
+ | |||
+ | Pro určení podobných slov byl použit program Wang2Vec (alternativa k známějšímu Word2Vec) s metodou pro výpočet parametrů modelu Noise Contrastive Estimation. | ||
+ | |||
+ | === Mluvený jazyk === | ||
+ | |||
+ | ==Frekvence slova podle mluvčích (sociodemografické údaje)== | ||
+ | |||
+ | Z grafů je patrné, jak často je zadané slovo používáno skupinami mluvčích podle pohlaví, věku a nejvyššího dosaženého vzdělání. Pro představu si můžete vyhledat slova jako //vole// (lemma //vůl//), //princip// nebo // | ||
+ | |||
+ | ==Oblasti podle tradičního nářečního členění== | ||
+ | |||
+ | Mapa znázorňuje používání zadaného slova v různých nářečních oblastech | ||
+ | |||
+ | ==Ukázka autentické promluvy== | ||
+ | |||
+ | Ukázky použití slova v autentických promluvách, | ||
+ | |||
+ | === Překlad na základě paralelního korpusu === | ||
+ | |||
+ | ==Doložené překlady== | ||
+ | |||
+ | Dlaždice ukazuje překladové ekvivalenty získané pomocí nástroje [[manualy: | ||
+ | |||
+ | ==Překlad v různých typech textu== | ||
+ | |||
+ | Zde se lze podívat na přehled různých překladů podle jednotlivých typů textů, které často souvisí s jiným kontextem. Např. jinak se bude překládat do angličtiny lexém //hustý// v publicistice (// | ||
+ | |||
+ | ==Ukázky překladu== | ||
+ | Ukázky překladu v paralelních textech pocházejí z korpusu [[cnk: | ||
===== Jak citovat WaG ===== | ===== Jak citovat WaG ===== |