Obsah

Klíčové slovo (keyword)

Termín klíčové slovo odkazuje ke dvěma významům:

  1. Vyhledaný výraz (slovo, tvar, jeho část nebo kombinace slov) v rámci konkordance, KWIC.
  2. Jednotka, jejíž frekvence v rámci textu je výrazně vyšší, než bychom mohli očekávat na základě frekvence této jednotky v referenčním korpusu (angl. keyword).

Keyword

Klíčová slova (ve druhém významu), tedy angl. keywords, a od nich odvozená analýza klíčových slov (keyword analysis) se používá v parolovému výzkumu textů jako východisko pro následnou interpretaci (diskurzní, literární, forenzní apod.). Klíčovými slovy jsou nejčastěji vlastní jména (často typická pro konkrétní text), žánrově specifické tvary (např. verba 1. os. pl. prez. pro kuchařky a návody), lexikální signály tématu textu, příp. doby jeho vzniku. Pro účely identifikace klíčových slov se používá specializovaný software, v rámci ČNK je to aplikace KWords.

Míra signifikance (významnosti) slova či jevu se vyhodnocuje nejčastěji pomocí testů log-likelihood, nebo chi2. Tyto testy spolehlivě vyhodnocují, zda je možné s přijatelnou mírou nejistoty mluvit o rozdílných frekvencích téhož jevu ve zkoumaném textu a v referenčním korpusu. Vedle toho je třeba dbát na zjištění míry relevance (tzv. effect-size), která vyjadřuje, do jaké míry jsou frekvence ve zkoumaném textu a v referenčním korpusu odlišné, a tedy relevantní pro následnou analýzu.

Příklad: Velmi frekventovaná slova (např. ale, jsem, když, v apod.) dosahují v mnoha případech velkých hodnot signifikance pomocí testů chi2 nebo log-likelihood. Je to způsobeno tím, že se vyskytují jak ve zkoumaném textu, tak v referenčním korpusu v takové míře, že není pochyb o tom, že jejich relativní frekvence jsou odlišné (míra nejistoty je velmi malá). To ovšem vůbec nemusí znamenat, že rozdíl, který mezi jejich relativními frekvencemi identifikujeme, je velký nebo pro následnou interpretaci relevantní.

Související odkazy