AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:keyword [2013/08/21 18:30] alzbetavitkovapojmy:keyword [2015/01/21 21:23] (aktuální) vaclavcvrcek
Řádek 4: Řádek 4:
  
   - Vyhledaný výraz (slovo, tvar, jeho část nebo kombinace slov) v rámci konkordance, [[pojmy:kwic|KWIC]].   - Vyhledaný výraz (slovo, tvar, jeho část nebo kombinace slov) v rámci konkordance, [[pojmy:kwic|KWIC]].
-  - Jednotka, jejíž frekvence v rámci textu je výrazně vyšší, než bychom mohli očekávat na základě frekvence této jednotky v referenčním korpusu (keyword). +  - Jednotka, jejíž frekvence v rámci textu je výrazně vyšší, než bychom mohli očekávat na základě frekvence této jednotky v referenčním korpusu (angl. //keyword//). 
  
 ===== Keyword ===== ===== Keyword =====
  
-Klíčová slova (ve druhém významu), keywords a od nich odvozená analýza klíčových slov se používá [[http://cs.wikipedia.org/wiki/Parole|parolovému]] výzkumu textů jako východisko pro následnou interpretaci (diskurzní, literární, forenzní apod.). Klíčovými slovy jsou nejčastěji vlastní jména (často typická pro konkrétní text), žánrově specifické tvary (např. verba 1. os. pl. prez. pro kuchařky a návody), lexikální signály tématu textu, příp. doby jeho vzniku.  +Klíčová slova (ve druhém významu), tedy angl. //keywords//, a od nich odvozená analýza klíčových slov (//keyword analysis//se používá [[http://cs.wikipedia.org/wiki/Parole|parolovému]] výzkumu textů jako východisko pro následnou interpretaci (diskurzní, literární, forenzní apod.). Klíčovými slovy jsou nejčastěji vlastní jména (často typická pro konkrétní text), žánrově specifické tvary (např. verba 1. os. pl. prez. pro kuchařky a návody), lexikální signály tématu textu, příp. doby jeho vzniku. Pro účely identifikace klíčových slov se používá specializovaný software, v rámci ČNK je to aplikace [[manualy:kwords|KWords]].
  
-Míra signifikance (významnosti) se vyhodnocuje nejčastěji pomocí testů [[pojmy:asociacni_miry#log-likelihood|log-likelihood]], nebo [[pojmy:chi2|chi2]],íp. prostým podílem relativních frekvencí ve zkoumaném textu a v referenčním korpusu (specificky je pak třeba ošetřit případy, kdy by ve jmenovateli vznikla 0). +Míra signifikance (významnosti) slova či jevu se vyhodnocuje nejčastěji pomocí testů [[pojmy:asociacni_miry#log-likelihood|log-likelihood]], nebo [[pojmy:chi2|chi2]]. Tyto testy spolehlivě vyhodnocujízda je možné s ijatelnou mírou nejistoty mluvit o rozdílných frekvencích téhož jevu ve zkoumaném textu a v referenčním korpusu. Vedle toho je třeba dbát na zjištění míry relevance (tzv. effect-size), která vyjadřuje, do jaké míry jsou frekvence ve zkoumaném textu a v referenčním korpusu odlišné, a tedy relevantní pro následnou analýzu. 
 + 
 +Příklad: Velmi frekventovaná slova (např. //ale, jsem, když, v// apod.) dosahují v mnoha případech velkých hodnot signifikance pomocí testů chi2 nebo log-likelihood. Je to způsobeno tím, že se vyskytují jak ve zkoumaném textu, tak v referenčním korpusu v takové míře, že není pochyb o tom, že jejich relativní frekvence jsou odlišné (míra nejistoty je velmi malá). To ovšem vůbec nemusí znamenat, že rozdíl, který mezi jejich relativními frekvencemi identifikujeme, je velký nebo pro následnou interpretaci relevantní.
  
 ==== Související odkazy ==== ==== Související odkazy ====
-<WRAP round box 49%>+ 
 +<WRAP round box 47%>
 [[http://kwords.korpus.cz|Aplikace KWords]] • [[pojmy:kwic|KWIC]] [[http://kwords.korpus.cz|Aplikace KWords]] • [[pojmy:kwic|KWIC]]
 </WRAP> </WRAP>