AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:within [2013/09/18 11:42] vaclavcvrcekpojmy:within [2015/01/21 21:54] (aktuální) vaclavcvrcek
Řádek 1: Řádek 1:
-====== Operátor within ======+====== Příkaz within ======
  
 Pokud potřebujeme omezit platnost dotazu na specifickou [[pojmy:atributy_strukturni|strukturu]], např. větu, můžeme využít operátor ''within'', který je součástí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] CQL. Ten je svojí funkčností velmi podobný operátoru ''[[pojmy:containing|containing]]'', rozdíly najdeme pouze v podobě výsledného [[pojmy:kwic|KWICu]]. Pokud potřebujeme omezit platnost dotazu na specifickou [[pojmy:atributy_strukturni|strukturu]], např. větu, můžeme využít operátor ''within'', který je součástí [[pojmy:dotazovaci_jazyk|dotazovacího jazyka]] CQL. Ten je svojí funkčností velmi podobný operátoru ''[[pojmy:containing|containing]]'', rozdíly najdeme pouze v podobě výsledného [[pojmy:kwic|KWICu]].
Řádek 5: Řádek 5:
 Typickým příkladem využití je situace, kdy chceme hledat dva jevy, vzdálené od sebe několik pozic, jejichž přesný počet neznáme, v rámci jedné věty. CQL dotaz Typickým příkladem využití je situace, kdy chceme hledat dva jevy, vzdálené od sebe několik pozic, jejichž přesný počet neznáme, v rámci jedné věty. CQL dotaz
  
-''[word="buď"] []* [word="nebo"] within <s />''+''[word=<nowiki>"</nowiki>buď<nowiki>"</nowiki>] []* [word=<nowiki>"</nowiki>nebo<nowiki>"</nowiki>] within <s />''
  
 najde všechny výskyty vícedílné spojky //buď - nebo// mezi nimiž je neurčený počet jiných slov v rámci jedné věty. najde všechny výskyty vícedílné spojky //buď - nebo// mezi nimiž je neurčený počet jiných slov v rámci jedné věty.
Řádek 11: Řádek 11:
 ===== Syntax ===== ===== Syntax =====
  
-Obecná syntax užití tohoto operátoru je: ''DOTAZ within DOTAZ''. Operátor ''within'' tedy nemusíme využívat pouze ve spojení se strukturními značkami, ale i v kombinaci s jinými dotazy. Budeme-li hledat sekvenci substantiv, která je z obou stran oddělena předložkami, můžeme využít následující CQL dotaz:+Obecná syntax užití tohoto operátoru je: ''DOTAZ within DOTAZ''. Operátor ''within'' tedy nemusíme využívat pouze ve spojení se strukturními značkami, ale i v kombinaci s jinými dotazy. Budeme-li hledat sekvenci substantiv, která je z obou stran oddělena adjektivy, můžeme využít následující CQL dotaz: 
 + 
 +''[pos=<nowiki>"</nowiki>N<nowiki>"</nowiki>] within [pos=<nowiki>"</nowiki>A<nowiki>"</nowiki>] []* [pos=<nowiki>"</nowiki>A<nowiki>"</nowiki>]'' 
 + 
 +Zároveň je možné ''operátor'' within využít i pro hledání v rozsáhlejších strukturách než jsou věty nebo konstrukce. Pomocí ''within'' můžeme vyhledávat pouze v určitých textech korpusu, např. jenom v beletrii, nebo v textech z určitého roku. Dotaz 
 + 
 +''[word=<nowiki>"</nowiki>řekli<nowiki>"</nowiki>] within <opus rokvyd=<nowiki>"</nowiki>20..<nowiki>"</nowiki> & txtype_group=<nowiki>"</nowiki>beletrie<nowiki>"</nowiki> />'' 
 + 
 +najde všechny výskyty slovního tvaru //řekli// v beletristických textech z roku 2000 a pozdějších. Operátor ''within'' je tak v základu definování [[pojmy:subkorpus|subkorpusů]]. 
 + 
 +**Negativní varianta** příkazu je ''within!'' a hledá všude s výjimkou struktur naznačených v podmínce, např. dotaz 
 + 
 +''[word=<nowiki>"</nowiki>práce<nowiki>"</nowiki>] within! <opus txtype=<nowiki>"</nowiki>PUB<nowiki>"</nowiki>/>'' 
 + 
 +hledá slovo //práce// ve všech textech korpusu s výjimkou publicistických. 
 + 
 + 
 +===== Výsledek ===== 
 + 
 +Výsledkem hledání dotazu s operátorem ''within'' je klíčové slovo (příp. klíčová slova) podle specifikace podmínkou předcházející operátoru ''within''. Např. v situaci, kdy hledáme podle dotazu 
 + 
 +''[lemma=<nowiki>"</nowiki>vlk<nowiki>"</nowiki>] []* [lemma=<nowiki>"</nowiki>koza<nowiki>"</nowiki>] within <s />'' 
 + 
 +bude jako [[pojmy:kwic|KWIC]] označena sekvence pozic začínající lemmatem vlk a končící lemmatem koza, nikoli celá věta, do které je tato sekvence zasazena. Právě v tomto ohledu se liší od operátoru [[pojmy:containing|containing]], což může mít implikace pro další efektivní práci s dotazem ([[manualy:kontext:filtr|filtrování]], [[manualy:kontext:frekvencni_distribuce|frekvenční distribuce]] apod.). 
 + 
 +^  Levý kontext  ^  KWIC  ^  Pravý kontext 
 +|  on " ví jak na to " , takže se |  <fc #FF0000>vlk nažere , ale koza</fc>  | zůstane celá . Byl opilý a hovořil americkou angličtinou -  | 
 +|  skutečnosti to úsporný balíček není . Má jediný smysl : |  <fc #FF0000>vlk se nenažere a koza</fc>  | chcípne . Později chcípne i vlk . Cílem balíčku je  | 
 +|  mi jasné , že se generál snažil , aby se |  <fc #FF0000>vlk nažral a koza</fc>  | zůstala celá . Těch pět dní domácího vězení stejně jako  | 
 +|  vztahovat nemohl . Poslední řešení je " nejčeštější " : |  <fc #FF0000>vlk se nažere , z kozy</fc>  | zůstane pár kostí , ale navenek , před obecenstvem je  | 
 +|  Chovatelé zde nehlídali dostatečně svá stáda . Jednomu z nich |  <fc #FF0000>vlci usmrtili osm ovcí a tři kozy</fc>  | , " řekl . Všechny velké šelmy žijící v Beskydech 
 +|  z oprýskané lišky se holým neporozuměním stala psice , z |  <fc #FF0000>vlka kočka , pes nebo liška , z kozy</fc>  | kamzík , z labutě orel nebo jen pouhá husa ,  | 
 +|  na projekty . " Byla to jen mediální bublina . |  <fc #FF0000>Vlk se nažral a koza</fc>  | zůstala celá . Chtěli nás umlčet . My jsme o   | 
 + 
 +==== Související odkazy ==== 
 + 
 +<WRAP round box 50%> 
 +''[[pojmy:containing|containing]]'' • [[kurz:subkorpusy|Vytváření subkorpusů]] • [[pojmy:dotazovaci_jazyk|Dotazovací jazyk]] 
 +</WRAP>
  
-''[pos="N"] within [pos=R"] []* [pos="R"]''