Toto je starší verze dokumentu!
Obsah
Menu: Filtr
Filtrování výsledku hledání (konkordance) slouží k zpřesnění původně položeného dotazu dodatečnou podmínkou. Obecně je možné říct, že jakýkoli filtr je možné nahradit složitějším CQL dotazem, nicméně v některých typech výzkumu je lepší postupovat od obecnějšího zadání postupným specifikováním výsledku, kterého chceme dosáhnout. Výhodou takové cesty je možnost průběžné kontroly toho, jaké výsledky se v konkordanci objevují.
Základními typy jsou filtry pozitivní a negativní specifikované dalším filtrujícím dotazem. Ve zvláštních případech se vyplatí použít připravený filtr odstranění vnořených shod a vyfiltrování prvních výskytů v dokumentech nebo ve větách.
Pozitivní filtr a negativní filtr
V rozhraní KonText máte na výběr ze dvou základních typů filtrování. Vyvolávají se přes položku Filtr > Pozitivní… a Filtr > Negativní… anebo stisknutím klávesy F
:
- P-filtr (pozitivní filtr)
- N-filtr (negativní filtr)
Zatímco pozitivní filtr slouží k výběru podmnožiny konkordancí z výchozího seznamu, negativní filtr umožňuje některé nehodící se konkordance ze seznamu vyřadit. V případě P-filtru tak uživatel specifikuje podmínku, jejíž splnění podmiňuje ponechání řádku v konkordančním seznamu. N-filtr na základě uživatelovy specifikace naopak identifikuje ty konkordance, které je třeba z výsledku vyřadit (to, co odpovídá podmínce, je vyloučeno).
Nastavení filtru
V rámci formuláře je třeba vybrat nastavení specifikující podmínku (ta je ve své podstatě dalším dotazem aplikovaným na výsledky původního hledání), zejména formulovat samotný filtrující dotaz (ať už jednoduchý, nebo pokročilý) a následně ve zvláštním oddílu formuláře upravit upřesňující parametry:
- Rozsah hledání, tj. rozsah kontextu, v němž se filtrovaný jev bude hledat; implicitně je nastaven na hledání v okolí pěti tokenů nalevo a napravo od KWICu (-5 5) včetně KWIC. Pokud chceme filtr omezit například jen na KWIC, změníme rozsah na nulový (0 0) včetně KWIC.
- Další parametry jsou stejné jako u úvodního dotazu: výchozí poziční atribut, který je při filtrování implicitně nastaven jako
word
; v režimu jednoduchého dotazu je to dále zohlednění velikosti písmen (case-sensitivity) a také povolení použití regulárních výrazů.
- Volba Zvýraznění shody (s hodnotami první shoda, poslední shoda) má smysl pouze při pozitivním filtrování:
Zvýraznění shody
Nastavení specifikuje, které z kontextových slov má být označeno jako kookurence ke KWICu v případě, že se v jeho okolí nachází takových slov víc. Představme si, že při hledání lemmatu klidný najdeme i větu:
Stal se nervózním a neklidným a jeho oči těkaly
.
Budeme-li chtít vyfiltrovat pouze ty konkordance, kde se v bezprostředním okolí lemmatu klidný objevuje spojka a, budeme mít v tomto případě dvě možnosti: buď jako kookurenci označíme předcházející spojku, nebo spojku následující za KWICem. Pokud v nastavení filtru zvolíme první shoda vybraný token, bude označen v hledaném kontextovém rozsahu ten nejvíce nalevo, v případě volby poslední shoda bude označen ten nejvíce napravo.
Vyhodnocení filtru
Vyhodnocení filtru automaticky přesměruje uživatele na stránku s aktualizovanou konkordancí. V případě negativního filtru jsou specifikované případy z konkordance vymazány (sníží se také počet konkordančních řádků). V případě filtru pozitivního jsou ve výsledné konkordanci pouze vyhovující řádky, celková frekvence je rovněž adekvátně snížena, kookurence v kontextu (jsou-li nějaké) jsou vyznačeny červenou barvou.
Odstranění vnořených shod
Volbu Filtr > Odstranit vnořené shody se vyplatí použít v případě, kdy výsledkům dotazu odpovídají různě dlouhé řetězce KWICů (struktury), které mohou být do sebe vnořeny. V takovém případě zůstane po odstranění vnořených shod zobrazena pouze struktura vnější, tj. nejdelší možný řetězec KWICů.
Například budeme chtít vyhledat doklady citoslovečného výrazu hip hurá, v němž se první slovo může libovolně opakovat. Zvolíme pokročilý dotaz [lc="hip"]+ [lc="hurá"]
, v němž se nerozlišuje velikost písmen. Výsledkem budou jak konkordance s jedním výskytem slova hip, tak s jeho více výskyty. V případě více výskytů slova hip se však mezi výsledky zároveň objeví i konkordance s jeho nižším počtem výskytů:
Položil jsem sluchátko a zařval jsem Hip hip hurá !
Položil jsem sluchátko a zařval jsem Hip hip hurá !
Po aplikaci filtru zůstane zobrazena pouze konkordance s vyzačeným KWICem Hip hip
, tj. vnější struktura s opakováním řetězce hip.
Odstranění vnořených shod je důležité zvláště tehdy, když potřebujeme s výsledky dále statisticky pracovat.
První nálezy v dokumentech a ve větách
Volby Filtr > První nálezy v dokumentech a Filtr > První nálezy ve větách mají částečně podobné využití jako odstranění vnořených shod, ale princip je odlišný.
''Jak ji znám , bojí se hospod jako čert kříže !
Tyto filtry použijeme v případě, kdy
První nálezy v dokumentech (zobrazí se pouze jeden -- první -- výskyt v daném dokumentu). FIXME