AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:kolokace [2013/06/18 17:24] – vytvořeno Václav Cvrčekpojmy:kolokace [2014/11/24 03:16] – [Související odkazy] Olga Richterova
Řádek 1: Řádek 1:
 ====== Kolokace ====== ====== Kolokace ======
  
-Kolokací (dříve se užával termín slovní spojení) se v rámci korpusové lingvistiky nejčastěji rozumí smysluplné, ustálené, syntagmatické spojení dvou (nebo víc) slovních tvarů (někdy celých lexémů) v blízkém kontextu. +Kolokací (dříve se užíval termín //slovní spojení//) se v rámci korpusové lingvistiky nejčastěji rozumí smysluplné, ustálené, syntagmatické spojení dvou (nebo víc) slovních tvarů (někdy celých lexémů) v blízkém kontextu. 
  
-===== Charakteristika kolokace =====+===== Charakteristika kolokací =====
  
-Vznik kolokace je podmíněn vzájemnou sémantickou kompatibilitou členů (srov. //psát dopis// × //*psát dřevo//) a její význam často přesahuje sumu významů každého z členů (kolokátů) chápaného izolovaně (//cestovní ruch//). Potřeba vymezení kolokací nabývá na důležitosti zejména v souvislosti s rozšířením korpusů, konkrétně v reakci na pozorování indikující, že volba jednoho prostředku předznamenává volbu prostředků v jeho blízkosti. Tento princip (pojmenovaný jako //idiom principle//, princip předurčeného výběru) kontrastuje s principem volného výběru (//open-choice principle//), který předpokládá volnou kombinovatelnost jednotek; ta však v absolutním smyslu nikdy neexistuje. +Vznik kolokace je podmíněn vzájemnou **sémantickou kompatibilitou** členů (schopností spojovat se v sousloví, srov. //psát dopis// × //*psát dřevo//) a její význam často přesahuje sumu významů každého z členů (kolokátů) chápaného izolovaně (//cestovní ruch//). Potřeba vymezení kolokací nabývá na důležitosti zejména v souvislosti s rozšířením korpusů, konkrétně v reakci na pozorování poukazující na fakt, že volba jednoho prostředku předznamenává volbu prostředků v jeho blízkosti. Tento princip (pojmenovaný jako //idiom principle//, princip předurčeného výběru) kontrastuje s principem volného výběru (//open-choice principle//), který předpokládá volnou kombinovatelnost jednotek; ta však v absolutním smyslu nikdy neexistuje. 
  
-Výrazem uplatnění principu předurčeného výběru jsou jednak kolokaqce, popř. [[pojmy:koligace|koligace]] a jednak frazémy. Kolokace představují svébytnou lexikální jednotku, je tedy možné u nich vymezovat všechny charakteristiky tradičně určované u jednoslovných lexémů (slovnědruhové zařazení, morfologické a syntaktické vlastnosti apod.).+Výrazem uplatnění principu předurčeného výběru jsou jednak kolokace (popř. [[pojmy:koligace|koligace]]a jednak frazémy. Kolokace představují samostatnou lexikální jednotku, je tedy možné u nich vymezovat všechny charakteristiky tradičně určované u jednoslovných lexémů (slovnědruhové zařazení, morfologické a syntaktické vlastnosti apod.).
  
 ===== Identifikace kolokací ===== ===== Identifikace kolokací =====
Řádek 13: Řádek 13:
 **Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//).  **Ustálenost** kolokací je měřitelná celkovou [[pojmy:frekvence|frekvencí]] spojení v korpusu (čím vyšší frekvence, tím ustálenější kolokace) a ovlivňuje ji také míra kompatibility jejích členů s ostatními jednotkami v korpusu (čím nižší, tím ustálenější). Specifickým typem jsou pak kombinace se slovy monokolokabilními, která jsou schopná vstupovat do kolokace pouze s velmi omezeným počtem lexémů/slovních tvarů (//tratoliště// se vyskytuje téměř výlučně ve spojení s tvarem //krve//). 
  
-**Syntagmatičnost** spojení se projevuje nejen existencí syntaktického vztahu mezi slovy, ale především v sémantice spojení: kolokace představuje v prvé řadě slovní spojení kompatibilní sémanticky, syntagmatičnost se však v některých případech projevuje také v tom, že některé významové aspekty slov, které do kolokace vstupují, se realizují až v souvýskytu se slovy jinými (//stroužek// označuje specifický tvar, realizuje se však téměř výlučně ve spojení se slovem //česnek//). Důraz na syntagmatičnost spojení se u kolokací projevuje také v tom, že k základovému slovu/frázi (//node//) se obyčejně hledají kolokáty v rámci úzce vymezeného kontextového okna (//span//) v textovém řetězu. Opakovaný souvýskyt dvou slov v bezprostředním kontextu (nebo také nízkou průměrnou vzdálenost, proximitu) je přitom možné chápat jako významný indikátor syntagmatičnosti jejich vztahu.+**Syntagmatičnost** spojení se projevuje nejen existencí syntaktického vztahu mezi slovy, ale především v sémantice spojení: kolokace představuje v prvé řadě slovní spojení kompatibilní sémanticky, syntagmatičnost se však v některých případech projevuje také v tom, že některé významové aspekty slov, které do kolokace vstupují, se realizují až v souvýskytu se slovy jinými (//stroužek// označuje specifický tvar, vyskytuje se však téměř výlučně ve spojení se slovem //česnek//). Důraz na syntagmatičnost spojení se u kolokací projevuje také v tom, že k základovému slovu/frázi (//node//) se obyčejně hledají kolokáty v rámci úzce vymezeného kontextového okna (//span//) v textovém řetězu. Opakovaný souvýskyt dvou slov v bezprostředním kontextu (nebo také nízkou průměrnou vzdálenost, proximitu) je přitom možné chápat jako významný indikátor syntagmatičnosti jejich vztahu.
  
 ===== Vymezení kolokací ===== ===== Vymezení kolokací =====
Řádek 20: Řádek 20:
   - volným syntagmatickým spojením (//hlavní změna//)   - volným syntagmatickým spojením (//hlavní změna//)
   - víceslovným termínům (//hlavní osa//)   - víceslovným termínům (//hlavní osa//)
-  - víceslovným propriím (//Hlavní nádraží Praha//)+  - víceslovným vlastním jménům (//Hlavní nádraží Praha//)
   - frazémům a idiomům (//ležet ladem//   - frazémům a idiomům (//ležet ladem//
   - individuálním autorským metaforám (//virové hrátky//).    - individuálním autorským metaforám (//virové hrátky//). 
  
-K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek do kolokace vstupujících, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikujcí automaticky všechny ostatní. Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. +K identifikaci kolokací se v praxi používají statistické [[pojmy:asociacni_miry|asociační míry]], které ve většině případů dávají do vztahu frekvenci jednotek vstupujících do kolokace, frekvenci celého spojení a případně také velikost korpusu. Mezi nejběžnější patří MI-score, t-score, log-likelihood, logDice, Z-score ad. Každá asociační míra je citlivá na jiný druh kolokací, žádnou proto není možné označit za univerzálně platnou, identifikující automaticky všechny ostatní.  
 + 
 +Seznam kolokátů jednoho slova bývá někdy označován za **kolokační paradigma**. V případě velmi omezeného kolokačního paradigmatu mluvíme o tzv. **monokolokabilních slovech**, tj. slovech, která vyžadují ve svém blízkém kontextu výskyt jednoho referenčního slova, které se rekrutuje z velmi omezené skupiny (např. slovo //tratoliště// vyžaduje doplnění //krve//, slovní tvar //zásluze// se vyskytuje téměř výhradně ve spojení //po zásluze potrestán// apod.) 
 + 
 +O jiných termínech vymezujících ustálené souvýskyty slov pojednáváme pod hlavičkou [[pojmy:bundles|lexical bundles]]. 
 +==== Související odkazy ==== 
 + 
 +<WRAP round box 49%> 
 +[[pojmy:asociacni_miry|Asociační míry]] • [[pojmy:corpus_driven|Corpus-driven přístup]] • [[pojmy:koligace|Koligace]] • [[pojmy:bundles|Lexical bundles]] 
 +</WRAP>