Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
kurz:pokrocile_dotazy [2018/08/08 10:59] – [Vyzkoušejte si na závěr] michalskrabal | kurz:pokrocile_dotazy [2021/01/06 10:03] – michalskrabal |
---|
====== 5. lekce: Dotazovací jazyk CQL. Pokročilé dotazy. ====== | ====== 5. lekce: Dotazovací jazyk CQL. Pokročilé dotazy. ====== |
| |
V páté lekci se zaměříme na klíčovou dovednost, která teprve umožní plně využívat všechny možnosti nabízené naším [[kontext|rozhraním KonText]]: jde o ovládnutí dotazovacího jazyka [[pojmy:dotazovaci_jazyk|CQL]]. Tento typ dotazu úzce souvisí také se zvládnutím tzv. [[pojmy:regularni_vyrazy|regulárních výrazů]], s nimiž jsme se seznámili v předešlé lekci. | V páté lekci se zaměříme na klíčovou dovednost, která teprve umožní plně využívat všechny možnosti nabízené naším [[kontext|rozhraním KonText]]. Jde o ovládnutí dotazovacího jazyka CQL, který úzce souvisí se zvládnutím tzv. [[pojmy:regularni_vyrazy|regulárních výrazů]], s nimiž jsme se seznámili v předešlé lekci. |
| |
| Korpusový [[pojmy:dotazovaci_jazyk|dotazovací jazyk]] (CQL, Corpus Query Language) je formální jazyk, který slouží k vyhledávání v korpusu. Budete-li chtít formulovat dotaz přímo v CQL, je nutné v KonTextu nad vyhledávacím okénkem aktivovat přepínač **Pokročilý dotaz**. CQL slouží jak k zadávání velmi složitých dotazů (např. vyhledej všechny výskyty adjektiv v superlativu v jiném pádě než nominativ, po nichž v textu nenásleduje substantivum ani interpunkce), tak i k zadávání dotazů jednoduchých (např. najdi výskyty lemmatu //oko//). Právě v možnosti vyhledávat pomocí velmi sofistikovaných kritérií tkví základní kvalitativní rozdíl mezi korpusovým vyhledávačem a běžným fulltextovým hledáním, které využíváme např. při práci s Googlem. |
| |
Korpusový [[pojmy:dotazovaci_jazyk|dotazovací jazyk]] (CQL, Corpus Query Language) je formální jazyk, který slouží k vyhledávání v korpusu. Budete-li chtít formulovat dotaz přímo v CQL, je nutné ho zadat prostřednictvím příslušného [[kurz:prvni_dotaz#typy_dotazu|typu dotazu]] (**CQL**). Všechny ostatní typy dotazů se do dotazovacího jazyka překládají automaticky. CQL slouží jak k zadávání velmi složitých dotazů (např. vyhledej všechny výskyty adjektiv v superlativu v jiném pádě než nominativ, po nichž v textu nenásleduje substantivum ani interpunkce), tak i k zadávání dotazů jednoduchých (např. najdi výskyty lemmatu //oko//). Právě v možnosti vyhledávat pomocí velmi sofistikovaných kritérií tkví základní kvalitativní rozdíl mezi korpusovým vyhledávačem a běžným fulltextovým hledáním, které využíváme např. při práci s Googlem. | |
===== Základní formát CQL dotazu ===== | ===== Základní formát CQL dotazu ===== |
| |
Rozhraní KonText uživatelům umožňuje vložit do CQL dotazu formulář podmínky pomocí klikatelné nabídky. V rámci jedné věty lze díky tomu vyhledávat i pomocí automaticky vložené podmínky ''within <s id=%%".*"%%/>'' (lze interpretovat takto: hledej v rámci jedné //libovolné// věty). | Rozhraní KonText uživatelům umožňuje vložit do CQL dotazu formulář podmínky pomocí klikatelné nabídky. V rámci jedné věty lze díky tomu vyhledávat i pomocí automaticky vložené podmínky ''within <s id=%%".*"%%/>'' (lze interpretovat takto: hledej v rámci jedné //libovolné// věty). |
| |
[{{:kurz:vetybezsloves.png?400|Within vkládané přímo v rozhraní KonText FIXME}}] | [{{:kurz:vetybezsloves.png?400|Within vkládané přímo v rozhraní KonText }}] |
| |
===== Shoda (a neshoda) atributů ===== | ===== Shoda (a neshoda) atributů ===== |
<WRAP round help 60%> | <WRAP round help 60%> |
* Zkuste zformulovat dotaz, jímž ověříte ne/existující aktualizace přísloví //těžko na cvičišti, lehko na bojišti// v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2013pub|SYN2013PUB]]. | * Zkuste zformulovat dotaz, jímž ověříte ne/existující aktualizace přísloví //těžko na cvičišti, lehko na bojišti// v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2013pub|SYN2013PUB]]. |
* A z jiného soudku: Nadávek odvozených od německého //Herr Gott// je nemálo (např. //hergot//, //herdek//, //hernajs// a jistě vymyslíte další) Vyhledejte co nejvíc takovýchto odvozenin v korpusu [[cnk:oral2013|ORAL2013]] a zjistěte, zda se jejich užití liší podle regionů. | * A z jiného soudku: Nadávek odvozených od německého //Herr Gott// je nemálo (např. //hergot//, //herdek//, //hernajs// a jistě vymyslíte další). Vyhledejte co nejvíc takovýchto odvozenin v korpusu [[cnk:oral2013|ORAL2013]] a zjistěte, zda se jejich užití liší podle regionů. |
| |
Řešení naleznete opět na [[reseni_ukolu#lekce_5|zvláštní stránce]]. | Řešení naleznete opět na [[reseni_ukolu#lekce_5|zvláštní stránce]]. |