Následující verze | Předchozí verze |
pojmy:within [2013/09/18 11:39] – vytvořeno vaclavcvrcek | pojmy:within [2015/01/21 21:54] (aktuální) – vaclavcvrcek |
---|
====== Operátor within ====== | ====== Příkaz within ====== |
| |
Pokud potřebujeme omezit platnost dotazu na specifickou [[pojmy:atributy_strukturni|strukturu]], např. větu, můžeme využít operátor ''within'', který je součástí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] CQL. Ten je svojí funkčností velmi podobný operátoru ''[[pojmy:containing|containing]]'', rozdíly najdeme pouze v podobě výsledného [[pojmy:kwic|KWICu]]. | Pokud potřebujeme omezit platnost dotazu na specifickou [[pojmy:atributy_strukturni|strukturu]], např. větu, můžeme využít operátor ''within'', který je součástí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] CQL. Ten je svojí funkčností velmi podobný operátoru ''[[pojmy:containing|containing]]'', rozdíly najdeme pouze v podobě výsledného [[pojmy:kwic|KWICu]]. |
| |
Základní syntax užití tohoto operátoru je: ''DOTAZ within DOTAZ'' | |
| |
Typickým příkladem využití je situace, kdy chceme hledat dva jevy, vzdálené od sebe několik pozic, jejichž přesný počet neznáme, v rámci jedné věty. CQL dotaz | Typickým příkladem využití je situace, kdy chceme hledat dva jevy, vzdálené od sebe několik pozic, jejichž přesný počet neznáme, v rámci jedné věty. CQL dotaz |
| |
''[word="buď"] []* [word="nebo"] within <s />'' | ''[word=<nowiki>"</nowiki>buď<nowiki>"</nowiki>] []* [word=<nowiki>"</nowiki>nebo<nowiki>"</nowiki>] within <s />'' |
| |
najde všechny výskyty vícedílné spojky //buď - nebo// mezi nimiž je neurčený počet jiných slov v rámci jedné věty. | najde všechny výskyty vícedílné spojky //buď - nebo// mezi nimiž je neurčený počet jiných slov v rámci jedné věty. |
| |
| ===== Syntax ===== |
| |
| Obecná syntax užití tohoto operátoru je: ''DOTAZ within DOTAZ''. Operátor ''within'' tedy nemusíme využívat pouze ve spojení se strukturními značkami, ale i v kombinaci s jinými dotazy. Budeme-li hledat sekvenci substantiv, která je z obou stran oddělena adjektivy, můžeme využít následující CQL dotaz: |
| |
| ''[pos=<nowiki>"</nowiki>N<nowiki>"</nowiki>] within [pos=<nowiki>"</nowiki>A<nowiki>"</nowiki>] []* [pos=<nowiki>"</nowiki>A<nowiki>"</nowiki>]'' |
| |
| Zároveň je možné ''operátor'' within využít i pro hledání v rozsáhlejších strukturách než jsou věty nebo konstrukce. Pomocí ''within'' můžeme vyhledávat pouze v určitých textech korpusu, např. jenom v beletrii, nebo v textech z určitého roku. Dotaz |
| |
| ''[word=<nowiki>"</nowiki>řekli<nowiki>"</nowiki>] within <opus rokvyd=<nowiki>"</nowiki>20..<nowiki>"</nowiki> & txtype_group=<nowiki>"</nowiki>beletrie<nowiki>"</nowiki> />'' |
| |
| najde všechny výskyty slovního tvaru //řekli// v beletristických textech z roku 2000 a pozdějších. Operátor ''within'' je tak v základu definování [[pojmy:subkorpus|subkorpusů]]. |
| |
| **Negativní varianta** příkazu je ''within!'' a hledá všude s výjimkou struktur naznačených v podmínce, např. dotaz |
| |
| ''[word=<nowiki>"</nowiki>práce<nowiki>"</nowiki>] within! <opus txtype=<nowiki>"</nowiki>PUB<nowiki>"</nowiki>/>'' |
| |
| hledá slovo //práce// ve všech textech korpusu s výjimkou publicistických. |
| |
| |
| ===== Výsledek ===== |
| |
| Výsledkem hledání dotazu s operátorem ''within'' je klíčové slovo (příp. klíčová slova) podle specifikace podmínkou předcházející operátoru ''within''. Např. v situaci, kdy hledáme podle dotazu |
| |
| ''[lemma=<nowiki>"</nowiki>vlk<nowiki>"</nowiki>] []* [lemma=<nowiki>"</nowiki>koza<nowiki>"</nowiki>] within <s />'' |
| |
| bude jako [[pojmy:kwic|KWIC]] označena sekvence pozic začínající lemmatem vlk a končící lemmatem koza, nikoli celá věta, do které je tato sekvence zasazena. Právě v tomto ohledu se liší od operátoru [[pojmy:containing|containing]], což může mít implikace pro další efektivní práci s dotazem ([[manualy:kontext:filtr|filtrování]], [[manualy:kontext:frekvencni_distribuce|frekvenční distribuce]] apod.). |
| |
| ^ Levý kontext ^ KWIC ^ Pravý kontext ^ |
| | on " ví jak na to " , takže se | <fc #FF0000>vlk nažere , ale koza</fc> | zůstane celá . Byl opilý a hovořil americkou angličtinou - | |
| | skutečnosti to úsporný balíček není . Má jediný smysl : | <fc #FF0000>vlk se nenažere a koza</fc> | chcípne . Později chcípne i vlk . Cílem balíčku je | |
| | mi jasné , že se generál snažil , aby se | <fc #FF0000>vlk nažral a koza</fc> | zůstala celá . Těch pět dní domácího vězení stejně jako | |
| | vztahovat nemohl . Poslední řešení je " nejčeštější " : | <fc #FF0000>vlk se nažere , z kozy</fc> | zůstane pár kostí , ale navenek , před obecenstvem je | |
| | Chovatelé zde nehlídali dostatečně svá stáda . Jednomu z nich | <fc #FF0000>vlci usmrtili osm ovcí a tři kozy</fc> | , " řekl . Všechny velké šelmy žijící v Beskydech | |
| | z oprýskané lišky se holým neporozuměním stala psice , z | <fc #FF0000>vlka kočka , pes nebo liška , z kozy</fc> | kamzík , z labutě orel nebo jen pouhá husa , | |
| | na projekty . " Byla to jen mediální bublina . | <fc #FF0000>Vlk se nažral a koza</fc> | zůstala celá . Chtěli nás umlčet . My jsme o | |
| |
| ==== Související odkazy ==== |
| |
| <WRAP round box 50%> |
| ''[[pojmy:containing|containing]]'' • [[kurz:subkorpusy|Vytváření subkorpusů]] • [[pojmy:dotazovaci_jazyk|Dotazovací jazyk]] |
| </WRAP> |
| |