Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- manualy:kontext:filtr [2023/08/29 18:19] – [Odstranění vnořených shod] jankrivan
+++ manualy:kontext:filtr [2023/08/30 12:34] (aktuální) – [První nálezy ve větách] jankrivan
@@ Řádek 37: / Řádek 37: @@
 ==== Vyhodnocení filtru ====
-Vyhodnocení filtru automaticky přesměruje uživatele na stránku s aktualizovanou konkordancí. V případě negativního filtru jsou specifikované případy z konkordance vymazány (sníží se také počet konkordančních řádků). V případě filtru pozitivního jsou ve výsledné konkordanci pouze vyhovující řádky, celková frekvence je rovněž adekvátně snížena, kookurence v kontextu (jsou-li nějaké) jsou vyznačeny červenou barvou.
+Vyhodnocení filtru automaticky přesměruje uživatele na stránku s aktualizovanou konkordancí. V případě negativního filtru jsou specifikované případy z konkordance vymazány (čímž se sníží počet konkordančních řádků). V případě filtru pozitivního jsou ve výsledné konkordanci pouze vyhovující řádky, celková frekvence je rovněž adekvátně snížena, kookurence v kontextu (jsou-li nějaké) jsou vyznačeny červenou barvou.
 ===== Odstranění vnořených shod =====
-Volbu **Filtr > Odstranit vnořené shody** se vyplatí použít v případě, kdy výsledkům dotazu odpovídají různě dlouhé řetězce (struktury) KWICů, které mohou být do sebe vnořeny. V takovém případě zůstane po odstranění vnořených shod zobrazena pouze struktura vnější, tj. nejdelší možný řetězec KWICů.
+Volbu **Filtr > Odstranit vnořené shody** se vyplatí použít v případě, kdy výsledkům dotazu odpovídají různě dlouhé řetězce (struktury) KWICů, z nichž některé jsou do sebe vnořeny. V takovém případě zůstane po odstranění vnořených shod zobrazena pouze struktura vnější, tj. nejdelší možný řetězec KWICů.
 Například budeme chtít vyhledat doklady citoslovečného výrazu //hip hurá//, v němž se první slovo může libovolně opakovat. Zvolíme pokročilý dotaz ''%%[lc="hip"]+ [lc="hurá"]%%'', v němž se nerozlišuje velikost písmen. Výsledkem budou jak konkordance s jedním výskytem slova //hip//, tak s jeho více výskyty. V případě více výskytů slova //hip// se však mezi výsledky zároveň objeví i konkordance s jeho nižším počtem výskytů:
@@ Řádek 48: / Řádek 48: @@
 ''Položil jsem sluchátko a zařval jsem Hip <fc #FF0000>hip hurá</fc> !''
-Po aplikaci filtru zůstane zobrazena pouze konkordance s vyznačeným KWICem ''<fc #FF0000>Hip hip</fc>'', tj. vnější struktura s opakováním řetězce //hip//.
+Po aplikaci filtru zůstane zobrazena pouze konkordance s vyznačeným KWICem ''<fc #FF0000>Hip hip hurá</fc>'', tj. vnější struktura s opakováním řetězce //hip//.
 Odstranění vnořených shod je důležité zvláště tehdy, když potřebujeme s výsledky dále statisticky pracovat.
@@ Řádek 66: / Řádek 66: @@
 ==== První nálezy ve větách ===
-Filtrování pomocí prvních nálezů ve větách použijeme v případě, kdy se výsledky hledání opakují uvnitř jedné věty, ale nás opět zajímá pouze jeden (vždy se opět zobrazí ten první) doklad. Může jít například o hledání víceslovných spojení pomocí atributu [[seznamy:frazemy#oznaceni_automaticky_identifikovanych_viceslovnych_jednotek_v_korpusu|col_lemma]], který je k dispozici ve verzovaných korpusech SYN, např. v syn_v11.
+Filtrování pomocí prvních nálezů ve větách použijeme v případě, kdy se výsledky hledání opakují uvnitř jedné věty, ale nás opět zajímá pouze jeden (vždy se opět zobrazí ten první) doklad.
+Může jít například o hledání víceslovných spojení pomocí atributu [[seznamy:frazemy#oznaceni_automaticky_identifikovanych_viceslovnych_jednotek_v_korpusu|col_lemma]], který je k dispozici ve verzovaných korpusech SYN, např. v syn_v11.
 Zadáme-li dotaz ''%%[col_lemma="bát_se_jako_čert_kříže"]%%'', dostaneme mj. těchto pět výsledků:
@@ Řádek 76: / Řádek 78: @@
 ''Jak ji znám , bojí se hospod jako čert <fc #FF0000>kříže</fc> !''\\
 Totožnou hodnotou atributu col_lemma jsou totiž postupně označeny všechny části daného víceslovného spojení. Po použití filtru se pak už zobrazí jen první doklad, tedy jedna konkordance pro jedno víceslovné spojení (frazém //bát se jako čert kříže//), pouze s prvním slovem zvýrazněným jako KWIC.
+Jak bylo uvedeno na začátku této kapitoly, k podobným výsledkům se lze často dostat různými způsoby. Každá automaticky anotovaná kolokace má zároveň jednoho ze svých členů označeného pomocí dvoumístného pozičního atributu [[seznamy:frazemy#oznaceni_automaticky_identifikovanych_viceslovnych_jednotek_v_korpusu|col_type]] s písmenem ''H'' na druhé pozici. Na výše uvedené výsledky bychom tedy mohli uplatnit pozitivní filtr na pozici KWIC s hodnotou ''%%[col_type=".H"]%%'' nebo bychom úvodní dotaz také mohli přímo formulovat jako ''%%[col_lemma="bát_se_jako_čert_kříže" & col_type=".H"]%%'' V takovém případě se vždy zobrazí pouze doklad s vyznačeným tvarem //kříže//, protože jeho hodnota atributu col_type je rovna ''PH''.

Historie:

Rozdíly

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence