Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- kurz:hledani_kolokaci [2018/08/29 14:51] – jankocek
+++ kurz:hledani_kolokaci [2021/01/06 19:19] – [Filtrování konkordance] michalskrabal
@@ Řádek 43: / Řádek 43: @@
 Kolokace lze identifikovat také pomocí [[manualy:kontext:frekvencni_distribuce|frekvenční distribuce]] a filtrů. Filtry jsme dosud nepoužívali, proto nejprve několik slov obecně k nim.
-[{{ :manualy:kontext:filtr.png|Formulář pro filtr konkordance}}]
+[{{ :manualy:kontext:filtr.png|Formulář pro filtr konkordance}}]FIXME
 Každý dotaz – poté, co ho vyhodnotíme a získáme [[pojmy:konkordance|konkordanci]] – lze dodatečně filtrovat. K dispozici máme dva typy filtrů: **p** (pozitivní) a **n** (negativní). V obou případech jsme při filtrování vyzváni k tomu, abychom zadali dodatečnou podmínku (ve stejné formě, jako zadáváme dotaz); při p-filtru jsou ponechány v konkordanci pouze ty doklady, které této podmínce vyhovují, v případě n-filtru jsou naopak ty doklady, které jí vyhovují, z konkordance smazány.
-Oba typy filtrů najdeme v menu **[[manualy:kontext:filtr|Filtr → Pozitivní]]** či **Filtr → Negativní**. Jejich využití pro hledání kolokací si můžeme ukázat na příkladu lemmatu //kolega//, které má v [[cnk:syn2015|SYN2015]] celkem [[https://kontext.korpus.cz/view?q=~6VS0mBEr&attr_allpos=kw&attrs=word&corpname=syn2015&ctxattrs=word&pagesize=30&refs=%3Ddoc.title&structs=s&viewmode=kwic&|12 321]] výskytů. Pokud nás zajímají adjektivní přívlastky, které tomuto lemmatu předcházejí, můžeme použít pozitivní filtr, jímž konkordanci zúžíme pouze na ty případy, které našemu záměru vyhovují. Do zadání pozitivního filtru vyplníme tyto údaje:
+Oba typy filtrů najdeme v menu **[[manualy:kontext:filtr|Filtr → Pozitivní]]** či **Filtr → Negativní**. Jejich využití pro hledání kolokací si můžeme ukázat na příkladu lemmatu //kolega//, které má v [[cnk:syn2015|SYN2015]] celkem [[https://kontext.korpus.cz/view?q=~6VS0mBEr&attr_allpos=kw&attrs=word&corpname=syn2015&ctxattrs=word&pagesize=30&refs=%3Ddoc.title&structs=s&viewmode=kwic&|12 321]] výskytů. Pokud nás zajímají adjektivní přívlastky, které tomuto lemmatu předcházejí, můžeme použít pozitivní filtr, jímž konkordanci zúžíme pouze na ty případy, které našemu záměru vyhovují. Do zadání pozitivního filtru (přes horní menu) vyplníme tyto údaje:
-Filtr: **pozitivní** (chceme ponechat příklady s předcházejícím adjektivem)\\
+Typ dotazu: přepnout přepínač **Pokročílý dotaz**
-Rozsah: od **-1** do **-1** (jde nám pouze o bezprostředně předcházející pozici)\\
-Typ dotazu: **CQL**\\
 Dotaz: ''%%[pos="A"]%%'' (hledá všechna adjektiva na dané pozici, viz atribut [[pojmy:pos|pos]])
+Rozsah hledání (v Upřesnit parametry): od **-1** do **-1** (jde nám pouze o bezprostředně předcházející pozici)\\
+Zbylé možnosti necháme, jak jsou.
 Výsledkem je konkordance, která obsahuje [[https://kontext.korpus.cz/view?q=~4T4SSHFn&attr_allpos=kw&attrs=word&corpname=syn2015&ctxattrs=word&pagesize=30&refs=%3Ddoc.title&structs=s&viewmode=kwic&|3275]] výskytů lemmatu //kolega//, kterému poředchází adjektivum. Ačkoli není zaručeno, že se bude jednat o shodný přívlastek, ve většině případů tomu tak je (můžeme si to ověřit na [[kurz:vytvareni_vzorku|vzorku]]).
@@ Řádek 77: / Řádek 77: @@
 Pro výpočet asociačních měr je důležité tzv. okno, z něhož se vychází (tj. počet pozic napravo a nalevo od [[pojmy:kwic|KWICu]], které jsou považovány za potenciální kolokáty). Pro většinu výzkumů doporučujeme okno v rozmezí pozic -3 až +3 od KWICu. Podle povahy výzkumné otázky je možné -- a mnohdy i žádoucí -- toto nastavení změnit, např. pokud vyhledáváme pouze přívlastky určitého substantiva (jako v případě uvedeném výše), vhodné okno bude mít rozmezí -1 až -1 (tedy pouze první pozice vlevo od daného substantiva).
-[{{:kurz:kolokace-formular-default.png?direct&300|Výchozí nastavení formuláře pro identifikaci kolokací FIXME}}]
+[{{:kurz:kolokace-formular-default.png?direct&300|Výchozí nastavení formuláře pro identifikaci kolokací }}]
 === Příklad: Rozdíly v kolokátech podle měr ===
@@ Řádek 105: / Řádek 105: @@
   * Jakýmsi kompromisem je míra [[pojmy:logdice|logDice]] (2. sloupec), která více zohledňuje jak frekvenci, tak nenáhodnost souvýskytu obou výrazů. Vidět to je na již zmíněné specifické kolokaci //tratoliště krve//, kterou logDice neupozaďuje tolik jako T-score, ale uvádí ji na 92. místě (oproti 205. místu u T-score) -- takto nízké umístění zajímavé kolokace může lehce ujít badatelově pozornosti. Výsledky této kompromisní míry je proto výhodné doplnit výsledky měr ostatních, především MI-score.
-[{{:kurz:krev_kolokace_lemmata.png?400|Kolokace lemmatu //krev// setříděné podle míry logDice FIXME}}]
+[{{:kurz:krev_kolokace_lemmata.png?400|Kolokace lemmatu //krev// setříděné podle míry logDice }}]
 === Změna nastavení hodnot ===

Historie:

Rozdíly

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence