Obsah

Příkaz within

Pokud potřebujeme omezit platnost dotazu na specifickou strukturu, např. větu, můžeme využít operátor within, který je součástí dotazovacího jazyka CQL. Ten je svojí funkčností velmi podobný operátoru containing, rozdíly najdeme pouze v podobě výsledného KWICu.

Typickým příkladem využití je situace, kdy chceme hledat dva jevy, vzdálené od sebe několik pozic, jejichž přesný počet neznáme, v rámci jedné věty. CQL dotaz

[word="buď"] []* [word="nebo"] within <s />

najde všechny výskyty vícedílné spojky buď - nebo mezi nimiž je neurčený počet jiných slov v rámci jedné věty.

Syntax

Obecná syntax užití tohoto operátoru je: DOTAZ within DOTAZ. Operátor within tedy nemusíme využívat pouze ve spojení se strukturními značkami, ale i v kombinaci s jinými dotazy. Budeme-li hledat sekvenci substantiv, která je z obou stran oddělena adjektivy, můžeme využít následující CQL dotaz:

[pos="N"] within [pos="A"] []* [pos="A"]

Zároveň je možné operátor within využít i pro hledání v rozsáhlejších strukturách než jsou věty nebo konstrukce. Pomocí within můžeme vyhledávat pouze v určitých textech korpusu, např. jenom v beletrii, nebo v textech z určitého roku. Dotaz

[word="řekli"] within <opus rokvyd="20.." & txtype_group="beletrie" />

najde všechny výskyty slovního tvaru řekli v beletristických textech z roku 2000 a pozdějších. Operátor within je tak v základu definování subkorpusů.

Negativní varianta příkazu je within! a hledá všude s výjimkou struktur naznačených v podmínce, např. dotaz

[word="práce"] within! <opus txtype="PUB"/>

hledá slovo práce ve všech textech korpusu s výjimkou publicistických.

Výsledek

Výsledkem hledání dotazu s operátorem within je klíčové slovo (příp. klíčová slova) podle specifikace podmínkou předcházející operátoru within. Např. v situaci, kdy hledáme podle dotazu

[lemma="vlk"] []* [lemma="koza"] within <s />

bude jako KWIC označena sekvence pozic začínající lemmatem vlk a končící lemmatem koza, nikoli celá věta, do které je tato sekvence zasazena. Právě v tomto ohledu se liší od operátoru containing, což může mít implikace pro další efektivní práci s dotazem (filtrování, frekvenční distribuce apod.).

Levý kontext KWIC Pravý kontext
on „ ví jak na to “ , takže se vlk nažere , ale koza zůstane celá . Byl opilý a hovořil americkou angličtinou -
skutečnosti to úsporný balíček není . Má jediný smysl : vlk se nenažere a koza chcípne . Později chcípne i vlk . Cílem balíčku je
mi jasné , že se generál snažil , aby se vlk nažral a koza zůstala celá . Těch pět dní domácího vězení stejně jako
vztahovat nemohl . Poslední řešení je „ nejčeštější “ : vlk se nažere , z kozy zůstane pár kostí , ale navenek , před obecenstvem je
Chovatelé zde nehlídali dostatečně svá stáda . Jednomu z nich vlci usmrtili osm ovcí a tři kozy , „ řekl . Všechny velké šelmy žijící v Beskydech
z oprýskané lišky se holým neporozuměním stala psice , z vlka kočka , pes nebo liška , z kozy kamzík , z labutě orel nebo jen pouhá husa ,
na projekty . “ Byla to jen mediální bublina . Vlk se nažral a koza zůstala celá . Chtěli nás umlčet . My jsme o

Související odkazy