AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:kolokace [2013/09/23 07:57] – [Vymezení kolokací] Olga Richterovapojmy:kolokace [2023/04/13 15:36] (aktuální) Jan Kocek
Řádek 10: Řádek 10:
  
 ===== Identifikace kolokací ===== ===== Identifikace kolokací =====
 +
 +[{{ :pojmy:kolokace.png?direct&500|Schématické znázornění extrakce kolokací v blízkém kontextu klíčového slova z konkordančního seznamu}}]
  
 **Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//).  **Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//). 
Řádek 17: Řádek 19:
 ===== Vymezení kolokací ===== ===== Vymezení kolokací =====
  
-Kolokace jsou jako pojem stále dosud terminologicky neustálené, existuje proto několik paralelních pohledů, které pod tento pojem zahrnují různě širokou škálu podobných jevů. Kolokace se tak v různých přístupech vymezují v opozici k +Kolokace jsou jako pojem dosud terminologicky neustálené, existuje proto několik paralelních pohledů, které pod tento pojem zahrnují různě širokou škálu podobných jevů. Kolokace se tak v různých přístupech vymezují v opozici k 
   - volným syntagmatickým spojením (//hlavní změna//)   - volným syntagmatickým spojením (//hlavní změna//)
   - víceslovným termínům (//hlavní osa//)   - víceslovným termínům (//hlavní osa//)
Řádek 23: Řádek 25:
   - frazémům a idiomům (//ležet ladem//   - frazémům a idiomům (//ležet ladem//
   - individuálním autorským metaforám (//virové hrátky//).    - individuálním autorským metaforám (//virové hrátky//). 
 +
 +V jiných přístupech jsou ale víceslovné termíny, víceslovná vlastní jména a frazémy/idiomy považovány za zvláštní typy kolokací (vedle kolokací  prostých).
  
 K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek vstupujících do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikující automaticky všechny ostatní.  K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek vstupujících do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikující automaticky všechny ostatní. 
  
 Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. V případě velmi omezeného kolokačního paradigmatu mluvíme o tzv. **monokolokabilních slovech**, tj. slovech, která vyžadují ve svém blízkém kontextu výskyt jednoho referenčního slova, které se rekrutuje z velmi omezené skupiny (např. slovo //tratoliště// vyžaduje doplnění //krve//, slovní tvar //zásluze// se vyskytuje téměř výhradně ve spojení //po zásluze potrestán// apod.) Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. V případě velmi omezeného kolokačního paradigmatu mluvíme o tzv. **monokolokabilních slovech**, tj. slovech, která vyžadují ve svém blízkém kontextu výskyt jednoho referenčního slova, které se rekrutuje z velmi omezené skupiny (např. slovo //tratoliště// vyžaduje doplnění //krve//, slovní tvar //zásluze// se vyskytuje téměř výhradně ve spojení //po zásluze potrestán// apod.)
 +
 +O jiných termínech vymezujících ustálené souvýskyty slov pojednáváme pod hlavičkou [[pojmy:bundles|lexical bundles]].
  
 ==== Související odkazy ==== ==== Související odkazy ====
-<WRAP round box 49%> + 
-[[pojmy:asociacni_miry|Asociační míry]] • [[pojmy:corpus_driven|Corpus-driven přístup]] • [[pojmy:koligace|Koligace]]+<WRAP round box 48%> 
 +[[pojmy:asociacni_miry|Asociační míry]] • [[pojmy:corpus_driven|Corpus-driven přístup]] • [[pojmy:koligace|Koligace]] • [[pojmy:bundles|Lexical bundles]]
 </WRAP> </WRAP>