Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:within [2013/09/23 10:36] – [Syntax] vaclavcvrcek | pojmy:within [2015/01/21 21:54] (aktuální) – vaclavcvrcek |
---|
====== Operátor within ====== | ====== Příkaz within ====== |
| |
Pokud potřebujeme omezit platnost dotazu na specifickou [[pojmy:atributy_strukturni|strukturu]], např. větu, můžeme využít operátor ''within'', který je součástí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] CQL. Ten je svojí funkčností velmi podobný operátoru ''[[pojmy:containing|containing]]'', rozdíly najdeme pouze v podobě výsledného [[pojmy:kwic|KWICu]]. | Pokud potřebujeme omezit platnost dotazu na specifickou [[pojmy:atributy_strukturni|strukturu]], např. větu, můžeme využít operátor ''within'', který je součástí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] CQL. Ten je svojí funkčností velmi podobný operátoru ''[[pojmy:containing|containing]]'', rozdíly najdeme pouze v podobě výsledného [[pojmy:kwic|KWICu]]. |
Typickým příkladem využití je situace, kdy chceme hledat dva jevy, vzdálené od sebe několik pozic, jejichž přesný počet neznáme, v rámci jedné věty. CQL dotaz | Typickým příkladem využití je situace, kdy chceme hledat dva jevy, vzdálené od sebe několik pozic, jejichž přesný počet neznáme, v rámci jedné věty. CQL dotaz |
| |
''[word="buď"] []* [word="nebo"] within <s />'' | ''[word=<nowiki>"</nowiki>buď<nowiki>"</nowiki>] []* [word=<nowiki>"</nowiki>nebo<nowiki>"</nowiki>] within <s />'' |
| |
najde všechny výskyty vícedílné spojky //buď - nebo// mezi nimiž je neurčený počet jiných slov v rámci jedné věty. | najde všechny výskyty vícedílné spojky //buď - nebo// mezi nimiž je neurčený počet jiných slov v rámci jedné věty. |
Obecná syntax užití tohoto operátoru je: ''DOTAZ within DOTAZ''. Operátor ''within'' tedy nemusíme využívat pouze ve spojení se strukturními značkami, ale i v kombinaci s jinými dotazy. Budeme-li hledat sekvenci substantiv, která je z obou stran oddělena adjektivy, můžeme využít následující CQL dotaz: | Obecná syntax užití tohoto operátoru je: ''DOTAZ within DOTAZ''. Operátor ''within'' tedy nemusíme využívat pouze ve spojení se strukturními značkami, ale i v kombinaci s jinými dotazy. Budeme-li hledat sekvenci substantiv, která je z obou stran oddělena adjektivy, můžeme využít následující CQL dotaz: |
| |
''[pos="N"] within [pos="A"] []* [pos="A"]'' | ''[pos=<nowiki>"</nowiki>N<nowiki>"</nowiki>] within [pos=<nowiki>"</nowiki>A<nowiki>"</nowiki>] []* [pos=<nowiki>"</nowiki>A<nowiki>"</nowiki>]'' |
| |
Zároveň je možné ''operátor'' within využít i pro hledání v rozsáhlejších strukturách než jsou věty nebo konstrukce. Pomocí ''within'' můžeme vyhledávat pouze v určitých textech korpusu, např. jenom v beletrii, nebo v textech z určitého roku. Dotaz | Zároveň je možné ''operátor'' within využít i pro hledání v rozsáhlejších strukturách než jsou věty nebo konstrukce. Pomocí ''within'' můžeme vyhledávat pouze v určitých textech korpusu, např. jenom v beletrii, nebo v textech z určitého roku. Dotaz |
| |
''[word="řekli"] within <opus rokvyd="20.." & txtype_group="beletrie" />'' | ''[word=<nowiki>"</nowiki>řekli<nowiki>"</nowiki>] within <opus rokvyd=<nowiki>"</nowiki>20..<nowiki>"</nowiki> & txtype_group=<nowiki>"</nowiki>beletrie<nowiki>"</nowiki> />'' |
| |
najde všechny výskyty slovního tvaru //řekli// v beletristických textech z roku 2000 a pozdějších. Operátor ''within'' je tak v základu definování [[pojmy:subkorpus|subkorpusů]]. | najde všechny výskyty slovního tvaru //řekli// v beletristických textech z roku 2000 a pozdějších. Operátor ''within'' je tak v základu definování [[pojmy:subkorpus|subkorpusů]]. |
**Negativní varianta** příkazu je ''within!'' a hledá všude s výjimkou struktur naznačených v podmínce, např. dotaz | **Negativní varianta** příkazu je ''within!'' a hledá všude s výjimkou struktur naznačených v podmínce, např. dotaz |
| |
''[word="práce"] within! <opus txtype="PUB"/>'' | ''[word=<nowiki>"</nowiki>práce<nowiki>"</nowiki>] within! <opus txtype=<nowiki>"</nowiki>PUB<nowiki>"</nowiki>/>'' |
| |
hledá slovo //práce// ve všech textech korpusu s výjimkou publicistických. | hledá slovo //práce// ve všech textech korpusu s výjimkou publicistických. |
Výsledkem hledání dotazu s operátorem ''within'' je klíčové slovo (příp. klíčová slova) podle specifikace podmínkou předcházející operátoru ''within''. Např. v situaci, kdy hledáme podle dotazu | Výsledkem hledání dotazu s operátorem ''within'' je klíčové slovo (příp. klíčová slova) podle specifikace podmínkou předcházející operátoru ''within''. Např. v situaci, kdy hledáme podle dotazu |
| |
''[lemma="vlk"] []* [lemma="koza"] within <s />'' | ''[lemma=<nowiki>"</nowiki>vlk<nowiki>"</nowiki>] []* [lemma=<nowiki>"</nowiki>koza<nowiki>"</nowiki>] within <s />'' |
| |
bude jako [[pojmy:kwic|KWIC]] označena sekvence pozic začínající lemmatem vlk a končící lemmatem koza, nikoli celá věta, do které je tato sekvence zasazena. Právě v tomto ohledu se liší od operátoru [[pojmy:containing|containing]], což může mít implikace pro další efektivní práci s dotazem ([[manual:menu:filtr|filtrování]], [[manual:menu:frekvencni_distribuce|frekvenční distribuce]] apod.). | bude jako [[pojmy:kwic|KWIC]] označena sekvence pozic začínající lemmatem vlk a končící lemmatem koza, nikoli celá věta, do které je tato sekvence zasazena. Právě v tomto ohledu se liší od operátoru [[pojmy:containing|containing]], což může mít implikace pro další efektivní práci s dotazem ([[manualy:kontext:filtr|filtrování]], [[manualy:kontext:frekvencni_distribuce|frekvenční distribuce]] apod.). |
| |
^ Levý kontext ^ KWIC ^ Pravý kontext ^ | ^ Levý kontext ^ KWIC ^ Pravý kontext ^ |
| z oprýskané lišky se holým neporozuměním stala psice , z | <fc #FF0000>vlka kočka , pes nebo liška , z kozy</fc> | kamzík , z labutě orel nebo jen pouhá husa , | | | z oprýskané lišky se holým neporozuměním stala psice , z | <fc #FF0000>vlka kočka , pes nebo liška , z kozy</fc> | kamzík , z labutě orel nebo jen pouhá husa , | |
| na projekty . " Byla to jen mediální bublina . | <fc #FF0000>Vlk se nažral a koza</fc> | zůstala celá . Chtěli nás umlčet . My jsme o | | | na projekty . " Byla to jen mediální bublina . | <fc #FF0000>Vlk se nažral a koza</fc> | zůstala celá . Chtěli nás umlčet . My jsme o | |
| |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
<WRAP round box 50%> | <WRAP round box 50%> |
''[[pojmy:containing|containing]]'' • [[manual:subkorpusy|Vytváření subkorpusů]] • [[pojmy:dotazovaci_jazyk|Dotazovací jazyk]] | ''[[pojmy:containing|containing]]'' • [[kurz:subkorpusy|Vytváření subkorpusů]] • [[pojmy:dotazovaci_jazyk|Dotazovací jazyk]] |
</WRAP> | </WRAP> |
| |