AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
manualy:kontext:filtr [2023/08/29 18:19] – [Odstranění vnořených shod] jankrivanmanualy:kontext:filtr [2023/08/30 12:34] (aktuální) – [První nálezy ve větách] jankrivan
Řádek 37: Řádek 37:
 ==== Vyhodnocení filtru ==== ==== Vyhodnocení filtru ====
  
-Vyhodnocení filtru automaticky přesměruje uživatele na stránku s aktualizovanou konkordancí. V případě negativního filtru jsou specifikované případy z konkordance vymazány (sníží se také počet konkordančních řádků). V případě filtru pozitivního jsou ve výsledné konkordanci pouze vyhovující řádky, celková frekvence je rovněž adekvátně snížena, kookurence v kontextu (jsou-li nějaké) jsou vyznačeny červenou barvou.+Vyhodnocení filtru automaticky přesměruje uživatele na stránku s aktualizovanou konkordancí. V případě negativního filtru jsou specifikované případy z konkordance vymazány (čímž se sníží počet konkordančních řádků). V případě filtru pozitivního jsou ve výsledné konkordanci pouze vyhovující řádky, celková frekvence je rovněž adekvátně snížena, kookurence v kontextu (jsou-li nějaké) jsou vyznačeny červenou barvou.
  
 ===== Odstranění vnořených shod ===== ===== Odstranění vnořených shod =====
  
-Volbu **Filtr > Odstranit vnořené shody** se vyplatí použít v případě, kdy výsledkům dotazu odpovídají různě dlouhé řetězce (struktury) KWICů, které mohou být do sebe vnořeny. V takovém případě zůstane po odstranění vnořených shod zobrazena pouze struktura vnější, tj. nejdelší možný řetězec KWICů.+Volbu **Filtr > Odstranit vnořené shody** se vyplatí použít v případě, kdy výsledkům dotazu odpovídají různě dlouhé řetězce (struktury) KWICů, z nichž některé jsou do sebe vnořeny. V takovém případě zůstane po odstranění vnořených shod zobrazena pouze struktura vnější, tj. nejdelší možný řetězec KWICů.
  
 Například budeme chtít vyhledat doklady citoslovečného výrazu //hip hurá//, v němž se první slovo může libovolně opakovat. Zvolíme pokročilý dotaz ''%%[lc="hip"]+ [lc="hurá"]%%'', v němž se nerozlišuje velikost písmen. Výsledkem budou jak konkordance s jedním výskytem slova //hip//, tak s jeho více výskyty. V případě více výskytů slova //hip// se však mezi výsledky zároveň objeví i konkordance s jeho nižším počtem výskytů: Například budeme chtít vyhledat doklady citoslovečného výrazu //hip hurá//, v němž se první slovo může libovolně opakovat. Zvolíme pokročilý dotaz ''%%[lc="hip"]+ [lc="hurá"]%%'', v němž se nerozlišuje velikost písmen. Výsledkem budou jak konkordance s jedním výskytem slova //hip//, tak s jeho více výskyty. V případě více výskytů slova //hip// se však mezi výsledky zároveň objeví i konkordance s jeho nižším počtem výskytů:
Řádek 48: Řádek 48:
 ''Položil jsem sluchátko a zařval jsem Hip <fc #FF0000>hip hurá</fc> !'' ''Položil jsem sluchátko a zařval jsem Hip <fc #FF0000>hip hurá</fc> !''
  
-Po aplikaci filtru zůstane zobrazena pouze konkordance s vyznačeným KWICem ''<fc #FF0000>Hip hip</fc>'', tj. vnější struktura s opakováním řetězce //hip//.+Po aplikaci filtru zůstane zobrazena pouze konkordance s vyznačeným KWICem ''<fc #FF0000>Hip hip hurá</fc>'', tj. vnější struktura s opakováním řetězce //hip//.
  
 Odstranění vnořených shod je důležité zvláště tehdy, když potřebujeme s výsledky dále statisticky pracovat. Odstranění vnořených shod je důležité zvláště tehdy, když potřebujeme s výsledky dále statisticky pracovat.
Řádek 66: Řádek 66:
 ==== První nálezy ve větách === ==== První nálezy ve větách ===
  
-Filtrování pomocí prvních nálezů ve větách použijeme v případě, kdy se výsledky hledání opakují uvnitř jedné věty, ale nás opět zajímá pouze jeden (vždy se opět zobrazí ten první) doklad. Může jít například o hledání víceslovných spojení pomocí atributu [[seznamy:frazemy#oznaceni_automaticky_identifikovanych_viceslovnych_jednotek_v_korpusu|col_lemma]], který je k dispozici ve verzovaných korpusech SYN, např. v syn_v11.+Filtrování pomocí prvních nálezů ve větách použijeme v případě, kdy se výsledky hledání opakují uvnitř jedné věty, ale nás opět zajímá pouze jeden (vždy se opět zobrazí ten první) doklad.  
 + 
 +Může jít například o hledání víceslovných spojení pomocí atributu [[seznamy:frazemy#oznaceni_automaticky_identifikovanych_viceslovnych_jednotek_v_korpusu|col_lemma]], který je k dispozici ve verzovaných korpusech SYN, např. v syn_v11.
  
 Zadáme-li dotaz ''%%[col_lemma="bát_se_jako_čert_kříže"]%%'', dostaneme mj. těchto pět výsledků: Zadáme-li dotaz ''%%[col_lemma="bát_se_jako_čert_kříže"]%%'', dostaneme mj. těchto pět výsledků:
Řádek 76: Řádek 78:
 ''Jak ji znám , bojí se hospod jako čert <fc #FF0000>kříže</fc> !''\\ ''Jak ji znám , bojí se hospod jako čert <fc #FF0000>kříže</fc> !''\\
  
-Totožnou hodnotou atributu col_lemma jsou totiž postupně označeny všechny části daného víceslovného spojení. Po použití filtru se pak už zobrazí jen první doklad, tedy jedna konkordance pro jedno víceslovné spojení (frazém //bát se jako čert kříže//), pouze s prvním slovem zvýrazněným jako KWIC.+Totožnou hodnotou atributu col_lemma jsou totiž postupně označeny všechny části daného víceslovného spojení. Po použití filtru se pak už zobrazí jen první doklad, tedy jedna konkordance pro jedno víceslovné spojení (frazém //bát se jako čert kříže//), pouze s prvním slovem zvýrazněným jako KWIC.  
 + 
 +Jak bylo uvedeno na začátku této kapitoly, k podobným výsledkům se lze často dostat různými způsoby. Každá automaticky anotovaná kolokace má zároveň jednoho ze svých členů označeného pomocí dvoumístného pozičního atributu [[seznamy:frazemy#oznaceni_automaticky_identifikovanych_viceslovnych_jednotek_v_korpusu|col_type]] s písmenem ''H'' na druhé pozici. Na výše uvedené výsledky bychom tedy mohli uplatnit pozitivní filtr na pozici KWIC s hodnotou ''%%[col_type=".H"]%%'' nebo bychom úvodní dotaz také mohli přímo formulovat jako ''%%[col_lemma="bát_se_jako_čert_kříže" & col_type=".H"]%%'' V takovém případě se vždy zobrazí pouze doklad s vyznačeným tvarem //kříže//, protože jeho hodnota atributu col_type je rovna ''PH''.