Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize | ||
manualy:kontext:kolokace [2018/08/03 17:18] – [Výpis kolokátů] Michal Škrabal | manualy:kontext:kolokace [2018/08/08 14:18] – Jan Kocek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== Menu: Kolokace ====== | ====== Menu: Kolokace ====== | ||
- | [{{ : | + | [{{ : |
Jednou ze stěžejních vlastností rozhraní KonText je možnost identifikovat pomocí statistických metod [[pojmy: | Jednou ze stěžejních vlastností rozhraní KonText je možnost identifikovat pomocí statistických metod [[pojmy: | ||
Řádek 11: | Řádek 11: | ||
- **Atribut**: | - **Atribut**: | ||
- | - **V kontextu**: specifikace kontextového okna (v okolí [[pojmy: | + | - **V kontextu**: specifikace kontextového okna (v okolí [[pojmy: |
- **Minimální frekvence kolokátu v korpusu**: stanovení minimální celkové frekvence jednotky, která může být do seznamu kolokátů zařazena (kolokátem lemmatu //dřevo// se tak v případě stanovení minimální frekvence 5 nemůžou stát jednotky, které se v celém korpusu vyskytují méně než pětkrát) | - **Minimální frekvence kolokátu v korpusu**: stanovení minimální celkové frekvence jednotky, která může být do seznamu kolokátů zařazena (kolokátem lemmatu //dřevo// se tak v případě stanovení minimální frekvence 5 nemůžou stát jednotky, které se v celém korpusu vyskytují méně než pětkrát) | ||
- **Minimální frekvence kolokátu v kontextu**: pokud jsme specifikovali kontextové okno hledání kolokátů od -3 do 3, pak volba minimální frekvence v rozsahu určuje, kolikrát se jednotka musí v okolí KWICu vyskytovat, aby byla zařazena do seznamu kolokátů (při výpočtu asociačních měr budou brány v potaz pouze jednotky, které se v okolí KWICu, v našem případě lemmatu //dřevo//, vyskytují stejně nebo vícekrát, než je zvolený limit) | - **Minimální frekvence kolokátu v kontextu**: pokud jsme specifikovali kontextové okno hledání kolokátů od -3 do 3, pak volba minimální frekvence v rozsahu určuje, kolikrát se jednotka musí v okolí KWICu vyskytovat, aby byla zařazena do seznamu kolokátů (při výpočtu asociačních měr budou brány v potaz pouze jednotky, které se v okolí KWICu, v našem případě lemmatu //dřevo//, vyskytují stejně nebo vícekrát, než je zvolený limit) | ||
Řádek 19: | Řádek 19: | ||
===== Výpis kolokátů ===== | ===== Výpis kolokátů ===== | ||
- | [{{ : | + | [{{ : |
Při setřídění výpisu podle [[pojmy: | Při setřídění výpisu podle [[pojmy: | ||
Řádek 25: | Řádek 25: | ||
V seznamu najdeme pro každou jednotku jednak celkovou frekvenci souvýskytu vyhledaného jevu a jeho kolokátu (např. lemmatu //dřevo// a kolokátu // | V seznamu najdeme pro každou jednotku jednak celkovou frekvenci souvýskytu vyhledaného jevu a jeho kolokátu (např. lemmatu //dřevo// a kolokátu // | ||
- | Na místě je dvojí upozornění: | + | <WRAP round important 70%> |
- V seznamu kolokátů se zobrazují všechna slova, která odpovídají specifikacím kontextového okna a minimální frekvence v korpusu a v rozsahu, bez ohledu na to, zda se skutečně o kolokát jedná či ne. Asociační míry slouží pouze k setřídění všech jednotek splňujících zadaná kritéria – to, jestli dané slovo skutečně funguje v kolokaci s vyhledaným jevem (jestli s ním např. tvoří syntagma), je otázka dalšího zkoumání, která nemůže být rozhodnuta čistě na základě hodnoty asociační míry (ta funguje spíše jako pomůcka pro odfiltrování nezajímavých a statisticky nevýznamných kolokátů na konec seznamu) | - V seznamu kolokátů se zobrazují všechna slova, která odpovídají specifikacím kontextového okna a minimální frekvence v korpusu a v rozsahu, bez ohledu na to, zda se skutečně o kolokát jedná či ne. Asociační míry slouží pouze k setřídění všech jednotek splňujících zadaná kritéria – to, jestli dané slovo skutečně funguje v kolokaci s vyhledaným jevem (jestli s ním např. tvoří syntagma), je otázka dalšího zkoumání, která nemůže být rozhodnuta čistě na základě hodnoty asociační míry (ta funguje spíše jako pomůcka pro odfiltrování nezajímavých a statisticky nevýznamných kolokátů na konec seznamu) | ||
- Každá [[pojmy: | - Každá [[pojmy: | ||
+ | </ | ||