Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:dotazovaci_jazyk [2013/11/11 20:26] – [Dotazovací jazyk užívaný v ČNK] lukasjanicik | pojmy:dotazovaci_jazyk [2015/03/20 12:12] – davidlukes |
---|
====== Dotazovací jazyk užívaný v ČNK ====== | ====== Dotazovací jazyk užívaný v ČNK ====== |
| |
Dotazovací jazyk užívaný v korpusech ČNK provozovaných na korpusovém manažeru [[pojmy:korpusovy_manazer#manatee|Manatee]] se nazývá **CQL (corpus query language)** a je jen mírně modifikovanou verzí původního jazyka CQL vytvořeného pro korpusový manažer [[pojmy:korpusovy_manazer#cwb|CWB]]. Jeho základním kamenem je dotaz na jednu pozici (slovo) v korpusu: | Dotazovací jazyk užívaný v korpusech ČNK provozovaných na korpusovém manažeru [[pojmy:korpusovy_manazer#manatee|Manatee]] se nazývá **[[http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying|CQL (corpus query language)]]** a je jen mírně modifikovanou verzí původního jazyka CQL vytvořeného pro korpusový manažer [[pojmy:korpusovy_manazer#cwb|CWB]]. Jeho základním kamenem je dotaz na jednu pozici (slovo) v korpusu: |
| |
''[atribut=<nowiki>"</nowiki>hodnota<nowiki>"</nowiki>]'' | ''[atribut=<nowiki>"</nowiki>hodnota<nowiki>"</nowiki>]'' |
| |
kde atributem se myslí [[pojmy:atributy_pozicni|atribut poziční]] (word, lemma, tag apod.), hodnotou je pak hledaný výraz sám, nebo vzor specifikovaný pomocí [[pojmy:regularni_vyrazy|regulárního výrazu]]. Součástí dotazu můžou být i omezení na [[pojmy:atributy_strukturni|strukturní atributy]] (věta, doc, opus), u nichž je možné specifikovat i další hodnoty (např. u opusů rok vydání, žánr, autor apod.). Omezení na strukturní atributy se na rozdíl od omezení na atributy poziční uvádějí ve špičatých závorkách. | kde atributem se myslí [[pojmy:atributy_pozicni|atribut poziční]] (word, lemma, tag apod.), hodnotou je pak hledaný výraz sám, nebo vzor specifikovaný pomocí [[pojmy:regularni_vyrazy|regulárního výrazu]]. Součástí dotazu můžou být i omezení na [[pojmy:atributy_strukturni|strukturní atributy]] (věta, doc, opus), u nichž je možné specifikovat i další hodnoty (např. u opusů rok vydání, žánr, autor apod.). Omezení na strukturní atributy se na rozdíl od omezení na atributy poziční uvádějí [[kurz:zobrazeni_dotazu#jak_vypada_tzv_vertikala|ve špičatých závorkách]] (např. ''<s id=%%"10"%%/>''); viz podrobnější a úplnější popis [[http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying|jazyka CQL]]. CQL je formální jazyk, jenž má přesnou (a konečnou) definici. CQL podporuje některé prvky tradičních [[pojmy:regularni_vyrazy|regulárních]] jazyků((Např. kvantifikátory, kulaté závorky a logické operátory.)), ale i rozšířené, specificky korpusové, příkazy jako je ''[[pojmy:within|within]]'', ''[[pojmy:meet|meet]]'', ''[[pojmy:union|union]]'' nebo ''[[pojmy:containing|containing]]'', které pracují se strukturou korpusu. |
| |
CQL je formální jazyk, jenž má přesnou (a konečnou) definici. CQL podporuje některé prvky tradičních [[pojmy:regularni_vyrazy|regulárních]] jazyků((Např. kvantifikátory, kulaté závorky a logické operátory.)), ale i rozšířené, specificky korpusové, příkazy jako je ''[[pojmy:within|within]]'', ''[[pojmy:meet|meet]]'', ''[[pojmy:union|union]]'' nebo ''[[pojmy:containing|containing]]'', které pracují se strukturou korpusu. | |
| |
Dotaz na více pozic současně (tedy sekvenci slov či širší kontext) vznikne prostým zřetězením dotazů na jednotlivé po sobě následující pozice. Např. dotaz ''[lemma=<nowiki>"</nowiki>mít<nowiki>"</nowiki>][][lemma=<nowiki>"</nowiki>srdce<nowiki>"</nowiki>]'' hledá všechny výskyty lemmat //mít// a //srdce//, mezi nimiž se vyskytuje libovolná pozice (tj. slovo nebo interpunkce). | Dotaz na více pozic současně (tedy sekvenci slov či širší kontext) vznikne prostým zřetězením dotazů na jednotlivé po sobě následující pozice. Např. dotaz ''[lemma=<nowiki>"</nowiki>mít<nowiki>"</nowiki>][][lemma=<nowiki>"</nowiki>srdce<nowiki>"</nowiki>]'' hledá všechny výskyty lemmat //mít// a //srdce//, mezi nimiž se vyskytuje libovolná pozice (tj. slovo nebo interpunkce). |
| |
Při práci s korpusovým manažerem je vhodné znát použitý dotazovací jazyk a jeho možnosti. Ačkoli některá uživatelská rozhraní umožňují zadávat dotaz i bez znalosti konkrétního dotazovacího jazyka, bývají v tomto případě možnosti práce s korpusem omezeny, což je dáno snahou o uživatelský komfort a srozumitelnost rozhraní, která je vždy na úkor plného využití bohatých kombinací možností vyhledávání. | Při práci s korpusovým manažerem je vhodné znát použitý dotazovací jazyk a jeho možnosti. Ačkoli některá uživatelská rozhraní umožňují zadávat dotaz i bez znalosti konkrétního dotazovacího jazyka, bývají v tomto případě možnosti práce s korpusem omezeny, což je dáno snahou o uživatelský komfort a srozumitelnost rozhraní, která je vždy na úkor plného využití bohatých kombinací možností vyhledávání. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
<WRAP round box 50%> | <WRAP round box 49%> |
[[pojmy:regularni_vyrazy|Regulární výrazy]] • [[manual:pokrocile_dotazy|Manuál: Pokročilé dotazy]] • [[pojmy:atributy_pozicni|Poziční atributy]] • [[manual:pokrocile_dotazy#co_v_korpusu_znamena_pozice|Co znamená pozice]] • [[http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying|Corpus Querying at sketchengine.co.uk]] | [[pojmy:regularni_vyrazy|Regulární výrazy]] • [[kurz:pokrocile_dotazy|Kurz: Pokročilé dotazy]] • [[pojmy:atributy_pozicni|Poziční atributy]] • [[kurz:pokrocile_dotazy#co_v_korpusu_znamena_pozice|Co znamená pozice]] • [[http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying|Corpus Querying at sketchengine.co.uk]] • [[pojmy:case-sensitive|Case-sensitive versus case-insensitive]] |
</WRAP> | </WRAP> |
| |