AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
kurz:pokrocile_dotazy [2018/08/08 10:55] – [Shoda (a neshoda) atributů] michalskrabalkurz:pokrocile_dotazy [2021/01/06 10:03] michalskrabal
Řádek 1: Řádek 1:
 ====== 5. lekce: Dotazovací jazyk CQL. Pokročilé dotazy. ====== ====== 5. lekce: Dotazovací jazyk CQL. Pokročilé dotazy. ======
  
-V páté lekci se zaměříme na klíčovou dovednost, která teprve umožní plně využívat všechny možnosti nabízené naším [[kontext|rozhraním KonText]]: jde o ovládnutí dotazovacího jazyka [[pojmy:dotazovaci_jazyk|CQL]]. Tento typ dotazu úzce souvisí také se zvládnutím tzv. [[pojmy:regularni_vyrazy|regulárních výrazů]], s nimiž jsme se seznámili v předešlé lekci.+V páté lekci se zaměříme na klíčovou dovednost, která teprve umožní plně využívat všechny možnosti nabízené naším [[kontext|rozhraním KonText]]. Jde o ovládnutí dotazovacího jazyka CQL, který úzce souvisí se zvládnutím tzv. [[pojmy:regularni_vyrazy|regulárních výrazů]], s nimiž jsme se seznámili v předešlé lekci
 + 
 +Korpusový [[pojmy:dotazovaci_jazyk|dotazovací jazyk]] (CQL, Corpus Query Language) je formální jazyk, který slouží k vyhledávání v korpusu. Budete-li chtít formulovat dotaz přímo v CQL, je nutné v KonTextu nad vyhledávacím okénkem aktivovat přepínač **Pokročilý dotaz**. CQL slouží jak k zadávání velmi složitých dotazů (např. vyhledej všechny výskyty adjektiv v superlativu v jiném pádě než nominativ, po nichž v textu nenásleduje substantivum ani interpunkce), tak i k zadávání dotazů jednoduchých (např. najdi výskyty lemmatu //oko//). Právě v možnosti vyhledávat pomocí velmi sofistikovaných kritérií tkví základní kvalitativní rozdíl mezi korpusovým vyhledávačem a běžným fulltextovým hledáním, které využíváme např. při práci s Googlem.
  
-Korpusový [[pojmy:dotazovaci_jazyk|dotazovací jazyk]] (CQL, Corpus Query Language) je formální jazyk, který slouží k vyhledávání v korpusu. Budete-li chtít formulovat dotaz přímo v CQL, je nutné ho zadat prostřednictvím příslušného [[kurz:prvni_dotaz#typy_dotazu|typu dotazu]] (**CQL**). Všechny ostatní typy dotazů se do dotazovacího jazyka překládají automaticky. CQL slouží jak k zadávání velmi složitých dotazů (např. vyhledej všechny výskyty adjektiv v superlativu v jiném pádě než nominativ, po nichž v textu nenásleduje substantivum ani interpunkce), tak i k zadávání dotazů jednoduchých (např. najdi výskyty lemmatu //oko//). Právě v možnosti vyhledávat pomocí velmi sofistikovaných kritérií tkví základní kvalitativní rozdíl mezi korpusovým vyhledávačem a běžným fulltextovým hledáním, které využíváme např. při práci s Googlem. 
 ===== Základní formát CQL dotazu ===== ===== Základní formát CQL dotazu =====
  
Řádek 120: Řádek 121:
 Rozhraní KonText uživatelům umožňuje vložit do CQL dotazu formulář podmínky pomocí klikatelné nabídky. V rámci jedné věty lze díky tomu vyhledávat i pomocí automaticky vložené podmínky ''within <s id=%%".*"%%/>'' (lze interpretovat takto: hledej v rámci jedné //libovolné// věty). Rozhraní KonText uživatelům umožňuje vložit do CQL dotazu formulář podmínky pomocí klikatelné nabídky. V rámci jedné věty lze díky tomu vyhledávat i pomocí automaticky vložené podmínky ''within <s id=%%".*"%%/>'' (lze interpretovat takto: hledej v rámci jedné //libovolné// věty).
  
-[{{:kurz:vetybezsloves.png?400|Within vkládané přímo v rozhraní KonText FIXME}}]+[{{:kurz:vetybezsloves.png?400|Within vkládané přímo v rozhraní KonText }}]
  
 ===== Shoda (a neshoda) atributů ===== ===== Shoda (a neshoda) atributů =====
Řádek 137: Řádek 138:
 '' %%1:[pos="N"] 2:[pos="A"] 3:[pos="N"] & 1.case = 2.case & 2.case != 3.case%% '' (najde sekvenci substantivum - adjektivum - substantivum, ve které se adjektivum shoduje v pádě s prvním substantivem, ale ne s druhým). '' %%1:[pos="N"] 2:[pos="A"] 3:[pos="N"] & 1.case = 2.case & 2.case != 3.case%% '' (najde sekvenci substantivum - adjektivum - substantivum, ve které se adjektivum shoduje v pádě s prvním substantivem, ale ne s druhým).
  
-<WRAP center round important 60%>+<WRAP round important 60%>
 Podmínky lze aplikovat pouze na celé atributy, ne na jejich části. Lze tak ověřovat shodu či neshodu celých slovních tvarů, lemmat nebo morfologických značek, ne však už například shodu v rodě nebo čísle (nemají-li samostatný atribut). Podmínky lze aplikovat pouze na celé atributy, ne na jejich části. Lze tak ověřovat shodu či neshodu celých slovních tvarů, lemmat nebo morfologických značek, ne však už například shodu v rodě nebo čísle (nemají-li samostatný atribut).
  
Řádek 144: Řádek 145:
 ===== Vyzkoušejte si na závěr ===== ===== Vyzkoušejte si na závěr =====
  
-Byla tato lekce náročná? Doufejme, že platí //těžko na cvičišti kurzu, lehko na bojišti praxe//. Nebo se nic podobného neříká?+Pravda, tato lekce byla poněkud náročná, doufejme však, že platí //těžko na cvičišti kurzu, lehko na bojišti praxe//. Nebo se nic podobného neříká?
  
 <WRAP round help 60%> <WRAP round help 60%>
   * Zkuste zformulovat dotaz, jímž ověříte ne/existující aktualizace přísloví //těžko na cvičišti, lehko na bojišti// v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2013pub|SYN2013PUB]].   * Zkuste zformulovat dotaz, jímž ověříte ne/existující aktualizace přísloví //těžko na cvičišti, lehko na bojišti// v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2013pub|SYN2013PUB]].
-  * A z jiného soudku: zaujaly vás někdy nadávky odvozené od německého //Herr Gott// jako např. //hergot//, //herdek// či //hernajs//Vyhledejte co nejvíc takovýchto odvozenin v korpusu [[cnk:oral2013|ORAL2013]] a zjistěte, zda se jejich užití liší podle regionů. +  * A z jiného soudku: Nadávek odvozených od německého //Herr Gott// je nemálo (např. //hergot//, //herdek////hernajs// a jistě vymyslíte další). Vyhledejte co nejvíc takovýchto odvozenin v korpusu [[cnk:oral2013|ORAL2013]] a zjistěte, zda se jejich užití liší podle regionů. 
  
 Řešení naleznete opět na [[reseni_ukolu#lekce_5|zvláštní stránce]]. Řešení naleznete opět na [[reseni_ukolu#lekce_5|zvláštní stránce]].