Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
pojmy:kolokace [2013/06/18 17:24]
Václav Cvrček vytvořeno
pojmy:kolokace [2014/11/24 12:40] (aktuální)
Václav Cvrček
Řádek 1: Řádek 1:
 ====== Kolokace ====== ====== Kolokace ======
  
-Kolokací (dříve se užával termín slovní spojení) se v rámci korpusové lingvistiky nejčastěji rozumí smysluplné,​ ustálené, syntagmatické spojení dvou (nebo víc) slovních tvarů (někdy celých lexémů) v blízkém kontextu. ​+Kolokací (dříve se užíval termín ​//slovní spojení//) se v rámci korpusové lingvistiky nejčastěji rozumí smysluplné,​ ustálené, syntagmatické spojení dvou (nebo víc) slovních tvarů (někdy celých lexémů) v blízkém kontextu. ​
  
-===== Charakteristika ​kolokace ​=====+===== Charakteristika ​kolokací ​=====
  
-Vznik kolokace je podmíněn vzájemnou sémantickou kompatibilitou členů (srov. //psát dopis// × //*psát dřevo//) a její význam často přesahuje sumu významů každého z členů (kolokátů) chápaného izolovaně (//​cestovní ruch//). Potřeba vymezení kolokací nabývá na důležitosti zejména v souvislosti s rozšířením korpusů, konkrétně v reakci na pozorování ​indikující, že volba jednoho prostředku předznamenává volbu prostředků v jeho blízkosti. Tento princip (pojmenovaný jako //idiom principle//,​ princip předurčeného výběru) kontrastuje s principem volného výběru (//​open-choice principle//​),​ který předpokládá volnou kombinovatelnost jednotek; ta však v absolutním smyslu nikdy neexistuje. ​+Vznik kolokace je podmíněn vzájemnou ​**sémantickou kompatibilitou** členů (schopností spojovat se v sousloví, ​srov. //psát dopis// × //*psát dřevo//) a její význam často přesahuje sumu významů každého z členů (kolokátů) chápaného izolovaně (//​cestovní ruch//). Potřeba vymezení kolokací nabývá na důležitosti zejména v souvislosti s rozšířením korpusů, konkrétně v reakci na pozorování ​poukazující na fakt, že volba jednoho prostředku předznamenává volbu prostředků v jeho blízkosti. Tento princip (pojmenovaný jako //idiom principle//,​ princip předurčeného výběru) kontrastuje s principem volného výběru (//​open-choice principle//​),​ který předpokládá volnou kombinovatelnost jednotek; ta však v absolutním smyslu nikdy neexistuje. ​
  
-Výrazem uplatnění principu předurčeného výběru jsou jednak ​kolokaqce, ​popř. [[pojmy:​koligace|koligace]] a jednak frazémy. Kolokace představují ​svébytnou ​lexikální jednotku, je tedy možné u nich vymezovat všechny charakteristiky tradičně určované u jednoslovných lexémů (slovnědruhové zařazení, morfologické a syntaktické vlastnosti apod.).+Výrazem uplatnění principu předurčeného výběru jsou jednak ​kolokace (popř. [[pojmy:​koligace|koligace]]a jednak frazémy. Kolokace představují ​samostatnou ​lexikální jednotku, je tedy možné u nich vymezovat všechny charakteristiky tradičně určované u jednoslovných lexémů (slovnědruhové zařazení, morfologické a syntaktické vlastnosti apod.).
  
 ===== Identifikace kolokací ===== ===== Identifikace kolokací =====
Řádek 13: Řádek 13:
 **Ustálenost** kolokací je měřitelná celkovou [[pojmy:​frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními,​ která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/​slovních tvarů (//​tratoliště//​ se vyskytuje téměř výlučně ve spojení s tvarem //​krve//​). ​ **Ustálenost** kolokací je měřitelná celkovou [[pojmy:​frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními,​ která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/​slovních tvarů (//​tratoliště//​ se vyskytuje téměř výlučně ve spojení s tvarem //​krve//​). ​
  
-**Syntagmatičnost** spojení se projevuje nejen existencí syntaktického vztahu mezi slovy, ale především v sémantice spojení: kolokace představuje v prvé řadě slovní spojení kompatibilní sémanticky,​ syntagmatičnost se však v některých případech projevuje také v tom, že některé významové aspekty slov, které do kolokace vstupují, se realizují až v souvýskytu se slovy jinými (//​stroužek//​ označuje specifický tvar, realizuje ​se však téměř výlučně ve spojení se slovem //​česnek//​). Důraz na syntagmatičnost spojení se u kolokací projevuje také v tom, že k základovému slovu/​frázi (//node//) se obyčejně hledají kolokáty v rámci úzce vymezeného kontextového okna (//span//) v textovém řetězu. Opakovaný souvýskyt dvou slov v bezprostředním kontextu (nebo také nízkou průměrnou vzdálenost,​ proximitu) je přitom možné chápat jako významný indikátor syntagmatičnosti jejich vztahu.+**Syntagmatičnost** spojení se projevuje nejen existencí syntaktického vztahu mezi slovy, ale především v sémantice spojení: kolokace představuje v prvé řadě slovní spojení kompatibilní sémanticky,​ syntagmatičnost se však v některých případech projevuje také v tom, že některé významové aspekty slov, které do kolokace vstupují, se realizují až v souvýskytu se slovy jinými (//​stroužek//​ označuje specifický tvar, vyskytuje ​se však téměř výlučně ve spojení se slovem //​česnek//​). Důraz na syntagmatičnost spojení se u kolokací projevuje také v tom, že k základovému slovu/​frázi (//node//) se obyčejně hledají kolokáty v rámci úzce vymezeného kontextového okna (//span//) v textovém řetězu. Opakovaný souvýskyt dvou slov v bezprostředním kontextu (nebo také nízkou průměrnou vzdálenost,​ proximitu) je přitom možné chápat jako významný indikátor syntagmatičnosti jejich vztahu.
  
 ===== Vymezení kolokací ===== ===== Vymezení kolokací =====
Řádek 20: Řádek 20:
   - volným syntagmatickým spojením (//hlavní změna//)   - volným syntagmatickým spojením (//hlavní změna//)
   - víceslovným termínům (//hlavní osa//)   - víceslovným termínům (//hlavní osa//)
-  - víceslovným ​propriím ​(//Hlavní nádraží Praha//)+  - víceslovným ​vlastním jménům ​(//Hlavní nádraží Praha//)
   - frazémům a idiomům (//ležet ladem//​) ​   - frazémům a idiomům (//ležet ladem//​) ​
   - individuálním autorským metaforám (//virové hrátky//​). ​   - individuálním autorským metaforám (//virové hrátky//​). ​
  
-K identifikaci kolokací se v praxi používají statistické [[pojmy:​asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu ​frekvenci jednotek do kolokace ​vstupujících, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood,​ logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, ​identifikujcí ​automaticky všechny ostatní. Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. ​+K identifikaci kolokací se v praxi používají statistické [[pojmy:​asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek ​vstupujících ​do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood,​ logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, ​identifikující ​automaticky všechny ostatní. ​ 
 + 
 +Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. ​V případě velmi omezeného kolokačního paradigmatu mluvíme o tzv. **monokolokabilních slovech**, tj. slovech, která vyžadují ve svém blízkém kontextu výskyt jednoho referenčního slova, které se rekrutuje z velmi omezené skupiny (např. slovo //​tratoliště//​ vyžaduje doplnění //krve//, slovní tvar //​zásluze//​ se vyskytuje téměř výhradně ve spojení //po zásluze potrestán//​ apod.) 
 + 
 +O jiných termínech vymezujících ustálené souvýskyty slov pojednáváme pod hlavičkou [[pojmy:​bundles|lexical bundles]]. 
 + 
 +==== Související odkazy ==== 
 + 
 +<WRAP round box 48%> 
 +[[pojmy:​asociacni_miry|Asociační míry]] • [[pojmy:​corpus_driven|Corpus-driven přístup]] • [[pojmy:​koligace|Koligace]] • [[pojmy:​bundles|Lexical bundles]] 
 +</​WRAP>​