Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
kurz:hledani_kolokaci [2016/09/26 17:36] – [Filtrování konkordance] jankocek | kurz:hledani_kolokaci [2016/09/26 17:43] – [Asociační míry] jankocek |
---|
Kolokace lze identifikovat také pomocí [[manualy:kontext:frekvencni_distribuce|frekvenční distribuce]] a filtrů. Filtry jsme dosud nepoužívali, proto nejprve několik slov obecně k nim. | Kolokace lze identifikovat také pomocí [[manualy:kontext:frekvencni_distribuce|frekvenční distribuce]] a filtrů. Filtry jsme dosud nepoužívali, proto nejprve několik slov obecně k nim. |
| |
[{{ :manualy:kontext:filtr.png|Formulář pro filtr konkordance <fc #ff0000></fc>}}] | [{{ :manualy:kontext:filtr.png|Formulář pro filtr konkordance}}] |
| |
Každý dotaz – poté, co ho vyhodnotíme a získáme [[pojmy:konkordance|konkordanci]] – lze dodatečně filtrovat. K dispozici máme dva typy filtrů: **p** (pozitivní) a **n** (negativní). V obou případech jsme při filtrování vyzváni k tomu, abychom zadali dodatečnou podmínku (ve stejné formě, jako zadáváme dotaz); při p-filtru jsou ponechány v konkordanci pouze ty doklady, které této podmínce vyhovují, v případě n-filtru jsou naopak ty doklady, které jí vyhovují, z konkordance smazány. | Každý dotaz – poté, co ho vyhodnotíme a získáme [[pojmy:konkordance|konkordanci]] – lze dodatečně filtrovat. K dispozici máme dva typy filtrů: **p** (pozitivní) a **n** (negativní). V obou případech jsme při filtrování vyzváni k tomu, abychom zadali dodatečnou podmínku (ve stejné formě, jako zadáváme dotaz); při p-filtru jsou ponechány v konkordanci pouze ty doklady, které této podmínce vyhovují, v případě n-filtru jsou naopak ty doklady, které jí vyhovují, z konkordance smazány. |
* Jakýmsi kompromisem je míra [[pojmy:logdice|logDice]] (2. sloupec), která více zohledňuje jak frekvenci, tak nenáhodnost souvýskytu obou výrazů. Vidět to je na již zmíněné specifické kolokaci //tratoliště krve//, kterou logDice neupozaďuje tolik jako T-score, ale uvádí ji na 66. místě (oproti 173. místu u T-score) -- takto nízké umístění zajímavé kolokace může lehce ujít badatelově pozornosti. Výsledky této kompromisní míry je proto výhodné doplnit výsledky měr ostatních, především MI-score. | * Jakýmsi kompromisem je míra [[pojmy:logdice|logDice]] (2. sloupec), která více zohledňuje jak frekvenci, tak nenáhodnost souvýskytu obou výrazů. Vidět to je na již zmíněné specifické kolokaci //tratoliště krve//, kterou logDice neupozaďuje tolik jako T-score, ale uvádí ji na 66. místě (oproti 173. místu u T-score) -- takto nízké umístění zajímavé kolokace může lehce ujít badatelově pozornosti. Výsledky této kompromisní míry je proto výhodné doplnit výsledky měr ostatních, především MI-score. |
| |
[{{:kurz:krev_kolokace_lemmata.png?400|Kolokace lemmatu //krev// setříděné podle míry logDice FIXME PROČ 3141 (1 STR.) STRAN JE 79}}] | [{{:kurz:krev_kolokace_lemmata.png?400|Kolokace lemmatu //krev// setříděné podle míry logDice}}] |
| |
=== Změna nastavení hodnot === | === Změna nastavení hodnot === |