Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
manual:kwords [2014/11/25 21:49] – vaclavcvrcek | manualy:kwords [2015/10/06 12:45] – Treq vaclavcvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== KWords ====== | ====== KWords ====== | ||
- | Aplikace KWords slouží k analýze textů na základě jejich srovnání s obecným územ (referenčním korpusem). Jejím cílem je identifikovat tzv. [[pojmy: | + | Aplikace KWords slouží k analýze textů na základě jejich srovnání s obecným územ (referenčním korpusem). Jejím cílem je identifikovat tzv. [[pojmy: |
- | {{ :manual: | + | {{ kurz: |
- | KWords je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez registrace všem uživatelům na adrese [[http:// | + | KWords je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez registrace všem uživatelům na adrese |
+ | |||
+ | Aplikace KWords byla původně | ||
Řádek 12: | Řádek 14: | ||
Identifikace [[pojmy: | Identifikace [[pojmy: | ||
- | Jako referenční korpus je možné | + | Výsledky analýzy jsou vždy ovlivněny volbou referenčního korpusu, který je třeba chápat jako neutrální jazykové pozadí, s nímž porovnáváme zkoumaný text. Např. při zkoumání novoročních projevů posledního komunistického prezidenta G. Husáka se jako prominentní ve srovnání se současným územ jeví slova // |
* pro češtinu | * pro češtinu | ||
* [[cnk: | * [[cnk: | ||
Řádek 26: | Řádek 28: | ||
* COCA -- [[http:// | * COCA -- [[http:// | ||
* InterCorp-EN v6 -- anglická část paralelního korpusu [[cnk: | * InterCorp-EN v6 -- anglická část paralelního korpusu [[cnk: | ||
+ | * InterCorp-EN v6 BEL ORIG -- originální (tj. nepřeložená) anglicky psaná beletrie z korpusu [[cnk: | ||
- | Text vložený uživatelem se nejprve [[pojmy: | + | Text vložený uživatelem se nejprve [[pojmy: |
$$DIN = 100 \times \frac{RelFq(Ttxt) - RelFq(RefC)}{RelFq(Ttxt) + RelFq(RefC)}$$ | $$DIN = 100 \times \frac{RelFq(Ttxt) - RelFq(RefC)}{RelFq(Ttxt) + RelFq(RefC)}$$ | ||
Řádek 36: | Řádek 39: | ||
* hodnota 100 značí, že slovo se vyskytuje pouze ve zkoumaném textu (může se tedy jednat o velmi prominentní slovo((V takovýchto případech je třeba mít na paměti, že absence slova v referenčním korpusu je situace zvláštní, | * hodnota 100 značí, že slovo se vyskytuje pouze ve zkoumaném textu (může se tedy jednat o velmi prominentní slovo((V takovýchto případech je třeba mít na paměti, že absence slova v referenčním korpusu je situace zvláštní, | ||
- | Hodnoty DIN v rozmezí 75-100 je možné považovat za velmi zajímavé a značí, že se jedná | + | Hodnoty DIN v rozmezí 75-100 je možné považovat za velmi zajímavé a značí, že se jedná pravděpodobně o prominentní jednotku, která může dobře posloužit jako východisko pro interpretaci celého textu. |
Aplikace KWords dále nabízí celou řadu doplňujících informací pro práci s klíčovými slovy. Vedle seznamu klíčových slov spolu s jejich hodnotami je to především graf disperze dat (ukazující postavení jednotlivých klíčových slov v textu), graf tzv. keyword links, tj. vztahů mezi klíčovými slovy v textu a také konkordanci klíčových slov pro analýzu jejich bezprostředního okolí. | Aplikace KWords dále nabízí celou řadu doplňujících informací pro práci s klíčovými slovy. Vedle seznamu klíčových slov spolu s jejich hodnotami je to především graf disperze dat (ukazující postavení jednotlivých klíčových slov v textu), graf tzv. keyword links, tj. vztahů mezi klíčovými slovy v textu a také konkordanci klíčových slov pro analýzu jejich bezprostředního okolí. | ||
- | Aplikace KWords byla navržena také pro vytváření analýz časových (nebo jiných) sérií dat. Pokud uživatel vloží na vstupu do aplikace víc textu, aktivuje režim tzv. **multi-analýzy**. V něm jsou analyzovány všechny vložené texty (maximální množství je 20) a výsledky z jednotlivých analýz porovnány na základě DIN. | + | Aplikace KWords byla navržena také pro vytváření analýz časových (nebo jiných) sérií dat. Pokud uživatel vloží na vstupu do aplikace víc textů (maximální množství je 20), aktivuje režim tzv. **multi-analýzy**. V něm jsou analyzovány všechny vložené texty a výsledky z jednotlivých analýz porovnány na základě DIN. |
===== Obrázky aplikace ===== | ===== Obrázky aplikace ===== | ||
+ | |||
+ | [{{: | ||
+ | [{{: | ||
+ | [{{: | ||
+ | [{{: | ||
+ | [{{: | ||
+ | [{{: | ||
==== Související odkazy ==== | ==== Související odkazy ==== | ||
- | <WRAP round box 49%> | + | <WRAP round box 50%> |
- | [[manual:menu: | + | [[manualy:kontext: |
</ | </ |