AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:keyword [2013/09/26 23:40] – [Klíčové slovo (keyword)] Pavel Vondřičkapojmy:keyword [2015/01/21 21:23] (aktuální) Václav Cvrček
Řádek 8: Řádek 8:
 ===== Keyword ===== ===== Keyword =====
  
-Klíčová slova (ve druhém významu), keywords a od nich odvozená analýza klíčových slov (keyword analysis) se používá [[http://cs.wikipedia.org/wiki/Parole|parolovému]] výzkumu textů jako východisko pro následnou interpretaci (diskurzní, literární, forenzní apod.). Klíčovými slovy jsou nejčastěji vlastní jména (často typická pro konkrétní text), žánrově specifické tvary (např. verba 1. os. pl. prez. pro kuchařky a návody), lexikální signály tématu textu, příp. doby jeho vzniku.  +Klíčová slova (ve druhém významu), tedy angl. //keywords//, a od nich odvozená analýza klíčových slov (//keyword analysis//) se používá [[http://cs.wikipedia.org/wiki/Parole|parolovému]] výzkumu textů jako východisko pro následnou interpretaci (diskurzní, literární, forenzní apod.). Klíčovými slovy jsou nejčastěji vlastní jména (často typická pro konkrétní text), žánrově specifické tvary (např. verba 1. os. pl. prez. pro kuchařky a návody), lexikální signály tématu textu, příp. doby jeho vzniku. Pro účely identifikace klíčových slov se používá specializovaný software, v rámci ČNK je to aplikace [[manualy:kwords|KWords]].
  
-Míra signifikance (významnosti) se vyhodnocuje nejčastěji pomocí testů [[pojmy:asociacni_miry#log-likelihood|log-likelihood]], nebo [[pojmy:chi2|chi2]]. Tyto testy spolehlivě vyhodnocují, zda je možné s přijatelnou mírou nejistoty mluvit o rozdílných frekvencích téhož jevu ve zkoumaném textu a v referenčním korpusu. Vedle toho je třeba dbát na zjištění míry relevance (tzv. effect-size), která vyjadřuje, do jaké míry jsou frekvence ve zkoumaném textu a v referenčním korpusu odlišné, a tedy relevantní pro následnou analýzu.+Míra signifikance (významnosti) slova či jevu se vyhodnocuje nejčastěji pomocí testů [[pojmy:asociacni_miry#log-likelihood|log-likelihood]], nebo [[pojmy:chi2|chi2]]. Tyto testy spolehlivě vyhodnocují, zda je možné s přijatelnou mírou nejistoty mluvit o rozdílných frekvencích téhož jevu ve zkoumaném textu a v referenčním korpusu. Vedle toho je třeba dbát na zjištění míry relevance (tzv. effect-size), která vyjadřuje, do jaké míry jsou frekvence ve zkoumaném textu a v referenčním korpusu odlišné, a tedy relevantní pro následnou analýzu.
  
 Příklad: Velmi frekventovaná slova (např. //ale, jsem, když, v// apod.) dosahují v mnoha případech velkých hodnot signifikance pomocí testů chi2 nebo log-likelihood. Je to způsobeno tím, že se vyskytují jak ve zkoumaném textu, tak v referenčním korpusu v takové míře, že není pochyb o tom, že jejich relativní frekvence jsou odlišné (míra nejistoty je velmi malá). To ovšem vůbec nemusí znamenat, že rozdíl, který mezi jejich relativními frekvencemi identifikujeme, je velký nebo pro následnou interpretaci relevantní. Příklad: Velmi frekventovaná slova (např. //ale, jsem, když, v// apod.) dosahují v mnoha případech velkých hodnot signifikance pomocí testů chi2 nebo log-likelihood. Je to způsobeno tím, že se vyskytují jak ve zkoumaném textu, tak v referenčním korpusu v takové míře, že není pochyb o tom, že jejich relativní frekvence jsou odlišné (míra nejistoty je velmi malá). To ovšem vůbec nemusí znamenat, že rozdíl, který mezi jejich relativními frekvencemi identifikujeme, je velký nebo pro následnou interpretaci relevantní.
Řádek 16: Řádek 16:
 ==== Související odkazy ==== ==== Související odkazy ====
  
-<WRAP round box 49%>+<WRAP round box 47%>
 [[http://kwords.korpus.cz|Aplikace KWords]] • [[pojmy:kwic|KWIC]] [[http://kwords.korpus.cz|Aplikace KWords]] • [[pojmy:kwic|KWIC]]
 </WRAP> </WRAP>