AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:kolokace [2014/11/24 12:40] Václav Cvrčekpojmy:kolokace [2023/04/13 15:36] (aktuální) Jan Kocek
Řádek 10: Řádek 10:
  
 ===== Identifikace kolokací ===== ===== Identifikace kolokací =====
 +
 +[{{ :pojmy:kolokace.png?direct&500|Schématické znázornění extrakce kolokací v blízkém kontextu klíčového slova z konkordančního seznamu}}]
  
 **Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//).  **Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//). 
Řádek 17: Řádek 19:
 ===== Vymezení kolokací ===== ===== Vymezení kolokací =====
  
-Kolokace jsou jako pojem stále dosud terminologicky neustálené, existuje proto několik paralelních pohledů, které pod tento pojem zahrnují různě širokou škálu podobných jevů. Kolokace se tak v různých přístupech vymezují v opozici k +Kolokace jsou jako pojem dosud terminologicky neustálené, existuje proto několik paralelních pohledů, které pod tento pojem zahrnují různě širokou škálu podobných jevů. Kolokace se tak v různých přístupech vymezují v opozici k 
   - volným syntagmatickým spojením (//hlavní změna//)   - volným syntagmatickým spojením (//hlavní změna//)
   - víceslovným termínům (//hlavní osa//)   - víceslovným termínům (//hlavní osa//)
Řádek 23: Řádek 25:
   - frazémům a idiomům (//ležet ladem//   - frazémům a idiomům (//ležet ladem//
   - individuálním autorským metaforám (//virové hrátky//).    - individuálním autorským metaforám (//virové hrátky//). 
 +
 +V jiných přístupech jsou ale víceslovné termíny, víceslovná vlastní jména a frazémy/idiomy považovány za zvláštní typy kolokací (vedle kolokací  prostých).
  
 K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek vstupujících do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikující automaticky všechny ostatní.  K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek vstupujících do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikující automaticky všechny ostatní.