Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:kolokace [2013/09/24 10:59] – Schvaleno pro 1. verzi vaclavcvrcek | pojmy:kolokace [2023/04/13 15:36] (aktuální) – jankocek |
---|
| |
===== Identifikace kolokací ===== | ===== Identifikace kolokací ===== |
| |
| [{{ :pojmy:kolokace.png?direct&500|Schématické znázornění extrakce kolokací v blízkém kontextu klíčového slova z konkordančního seznamu}}] |
| |
**Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//). | **Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//). |
===== Vymezení kolokací ===== | ===== Vymezení kolokací ===== |
| |
Kolokace jsou jako pojem stále dosud terminologicky neustálené, existuje proto několik paralelních pohledů, které pod tento pojem zahrnují různě širokou škálu podobných jevů. Kolokace se tak v různých přístupech vymezují v opozici k | Kolokace jsou jako pojem dosud terminologicky neustálené, existuje proto několik paralelních pohledů, které pod tento pojem zahrnují různě širokou škálu podobných jevů. Kolokace se tak v různých přístupech vymezují v opozici k |
- volným syntagmatickým spojením (//hlavní změna//) | - volným syntagmatickým spojením (//hlavní změna//) |
- víceslovným termínům (//hlavní osa//) | - víceslovným termínům (//hlavní osa//) |
- frazémům a idiomům (//ležet ladem//) | - frazémům a idiomům (//ležet ladem//) |
- individuálním autorským metaforám (//virové hrátky//). | - individuálním autorským metaforám (//virové hrátky//). |
| |
| V jiných přístupech jsou ale víceslovné termíny, víceslovná vlastní jména a frazémy/idiomy považovány za zvláštní typy kolokací (vedle kolokací prostých). |
| |
K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek vstupujících do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikující automaticky všechny ostatní. | K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek vstupujících do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikující automaticky všechny ostatní. |
| |
Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. V případě velmi omezeného kolokačního paradigmatu mluvíme o tzv. **monokolokabilních slovech**, tj. slovech, která vyžadují ve svém blízkém kontextu výskyt jednoho referenčního slova, které se rekrutuje z velmi omezené skupiny (např. slovo //tratoliště// vyžaduje doplnění //krve//, slovní tvar //zásluze// se vyskytuje téměř výhradně ve spojení //po zásluze potrestán// apod.) | Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. V případě velmi omezeného kolokačního paradigmatu mluvíme o tzv. **monokolokabilních slovech**, tj. slovech, která vyžadují ve svém blízkém kontextu výskyt jednoho referenčního slova, které se rekrutuje z velmi omezené skupiny (např. slovo //tratoliště// vyžaduje doplnění //krve//, slovní tvar //zásluze// se vyskytuje téměř výhradně ve spojení //po zásluze potrestán// apod.) |
| |
| O jiných termínech vymezujících ustálené souvýskyty slov pojednáváme pod hlavičkou [[pojmy:bundles|lexical bundles]]. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
<WRAP round box 49%> | <WRAP round box 48%> |
[[pojmy:asociacni_miry|Asociační míry]] • [[pojmy:corpus_driven|Corpus-driven přístup]] • [[pojmy:koligace|Koligace]] | [[pojmy:asociacni_miry|Asociační míry]] • [[pojmy:corpus_driven|Corpus-driven přístup]] • [[pojmy:koligace|Koligace]] • [[pojmy:bundles|Lexical bundles]] |
</WRAP> | </WRAP> |