Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
kurz:hledani_kolokaci [2018/08/08 11:56]
Václav Cvrček [Vyzkoušejte si na závěr]
kurz:hledani_kolokaci [2018/12/14 12:04]
Jan Kocek
Řádek 77: Řádek 77:
 Pro výpočet asociačních měr je důležité tzv. okno, z něhož se vychází (tj. počet pozic napravo a nalevo od [[pojmy:​kwic|KWICu]],​ které jsou považovány za potenciální kolokáty). Pro většinu výzkumů doporučujeme okno v rozmezí pozic -3 až +3 od KWICu. Podle povahy výzkumné otázky je možné -- a mnohdy i žádoucí -- toto nastavení změnit, např. pokud vyhledáváme pouze přívlastky určitého substantiva (jako v případě uvedeném výše), vhodné okno bude mít rozmezí -1 až -1 (tedy pouze první pozice vlevo od daného substantiva). Pro výpočet asociačních měr je důležité tzv. okno, z něhož se vychází (tj. počet pozic napravo a nalevo od [[pojmy:​kwic|KWICu]],​ které jsou považovány za potenciální kolokáty). Pro většinu výzkumů doporučujeme okno v rozmezí pozic -3 až +3 od KWICu. Podle povahy výzkumné otázky je možné -- a mnohdy i žádoucí -- toto nastavení změnit, např. pokud vyhledáváme pouze přívlastky určitého substantiva (jako v případě uvedeném výše), vhodné okno bude mít rozmezí -1 až -1 (tedy pouze první pozice vlevo od daného substantiva).
  
-[{{:​kurz:​kolokace-formular-default.png?​direct&​450|Výchozí nastavení formuláře pro identifikaci kolokací ​FIXME}}]+[{{:​kurz:​kolokace-formular-default.png?​direct&​300|Výchozí nastavení formuláře pro identifikaci kolokací }}]
  
 === Příklad: Rozdíly v kolokátech podle měr === === Příklad: Rozdíly v kolokátech podle měr ===
Řádek 105: Řádek 105:
   * Jakýmsi kompromisem je míra [[pojmy:​logdice|logDice]] (2. sloupec), která více zohledňuje jak frekvenci, tak nenáhodnost souvýskytu obou výrazů. Vidět to je na již zmíněné specifické kolokaci //​tratoliště krve//, kterou logDice neupozaďuje tolik jako T-score, ale uvádí ji na 92. místě (oproti 205. místu u T-score) -- takto nízké umístění zajímavé kolokace může lehce ujít badatelově pozornosti. Výsledky této kompromisní míry je proto výhodné doplnit výsledky měr ostatních, především MI-score.   * Jakýmsi kompromisem je míra [[pojmy:​logdice|logDice]] (2. sloupec), která více zohledňuje jak frekvenci, tak nenáhodnost souvýskytu obou výrazů. Vidět to je na již zmíněné specifické kolokaci //​tratoliště krve//, kterou logDice neupozaďuje tolik jako T-score, ale uvádí ji na 92. místě (oproti 205. místu u T-score) -- takto nízké umístění zajímavé kolokace může lehce ujít badatelově pozornosti. Výsledky této kompromisní míry je proto výhodné doplnit výsledky měr ostatních, především MI-score.
  
-[{{:​kurz:​krev_kolokace_lemmata.png?​400|Kolokace lemmatu //krev// setříděné podle míry logDice ​FIXME}}]+[{{:​kurz:​krev_kolokace_lemmata.png?​400|Kolokace lemmatu //krev// setříděné podle míry logDice }}]
  
 === Změna nastavení hodnot === === Změna nastavení hodnot ===
  
-Nebudeme-li hledat kolokáty jako lemmata, ale jako konkrétní tvary, ​bude to mít nějaký ​vliv? A jaký? ​Jak je vidět v tabulce, u logDice se v tomto případě pouze vyměnilo pořadí, T-score zůstalo stejné, ovšem z MI-score bylo //​tratoliště//​ vytlačeno tvarem //​prolitou//​. ​+Nebudeme-li hledat kolokáty jako lemmata, ale jako konkrétní tvary (bez ohledu na velikost písmentedy s využitím atributu [[pojmy:​lc|lc]]),​ může ​to mít na výsledek často zásadní ​vlivJak je vidět v tabulce, u logDice se v tomto případě pouze vyměnilo pořadí, T-score zůstalo stejné, ovšem z MI-score bylo //​tratoliště//​ vytlačeno tvarem //​prolitou//​. ​
  
 ^ míra / kolokáty ^ logDice ^ T-score ^ MI-score ^ ^ míra / kolokáty ^ logDice ^ T-score ^ MI-score ^