Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:dotazovaci_jazyk [2015/01/21 21:18] – Václav Cvrček | pojmy:dotazovaci_jazyk [2016/03/19 18:11] – [Dotazovací jazyk užívaný v ČNK] Michal Křen |
---|
====== Dotazovací jazyk užívaný v ČNK ====== | ====== Dotazovací jazyk užívaný v ČNK ====== |
| |
Dotazovací jazyk užívaný v korpusech ČNK provozovaných na korpusovém manažeru [[pojmy:korpusovy_manazer#manatee|Manatee]] se nazývá **[[http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying|CQL (corpus query language)]]** a je jen mírně modifikovanou verzí původního jazyka CQL vytvořeného pro korpusový manažer [[pojmy:korpusovy_manazer#cwb|CWB]]. Jeho základním kamenem je dotaz na jednu pozici (slovo) v korpusu: | Dotazovací jazyk užívaný v korpusech ČNK provozovaných na korpusovém manažeru [[pojmy:korpusovy_manazer#manatee|Manatee]] se nazývá **[[https://www.sketchengine.co.uk/corpus-querying/|CQL (corpus query language)]]** a je jen mírně modifikovanou verzí původního jazyka CQL vytvořeného pro korpusový manažer [[pojmy:korpusovy_manazer#cwb|CWB]]. Jeho základním kamenem je dotaz na jednu pozici (slovo) v korpusu: |
| |
''[atribut=<nowiki>"</nowiki>hodnota<nowiki>"</nowiki>]'' | ''[atribut=<nowiki>"</nowiki>hodnota<nowiki>"</nowiki>]'' |
| |
kde atributem se myslí [[pojmy:atributy_pozicni|atribut poziční]] (word, lemma, tag apod.), hodnotou je pak hledaný výraz sám, nebo vzor specifikovaný pomocí [[pojmy:regularni_vyrazy|regulárního výrazu]]. Součástí dotazu můžou být i omezení na [[pojmy:atributy_strukturni|strukturní atributy]] (věta, doc, opus), u nichž je možné specifikovat i další hodnoty (např. u opusů rok vydání, žánr, autor apod.). Omezení na strukturní atributy se na rozdíl od omezení na atributy poziční uvádějí viz podrobnější a úplnější popis [[http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying|jazyka CQL]][[kurz:zobrazeni_dotazu#jak_vypada_tzv_vertikala|ve špičatých závorkách]] (např. ''<s id=%%"10"%%/>''). | kde atributem se myslí [[pojmy:atributy_pozicni|atribut poziční]] (word, lemma, tag apod.), hodnotou je pak hledaný výraz sám, nebo vzor specifikovaný pomocí [[pojmy:regularni_vyrazy|regulárního výrazu]]. Součástí dotazu můžou být i omezení na [[pojmy:atributy_strukturni|strukturní atributy]] (věta, doc, opus), u nichž je možné specifikovat i další hodnoty (např. u opusů rok vydání, žánr, autor apod.). Omezení na strukturní atributy se na rozdíl od omezení na atributy poziční uvádějí [[kurz:zobrazeni_dotazu#jak_vypada_tzv_vertikala|ve špičatých závorkách]] (např. ''<s id=%%"10"%%/>''); viz podrobnější a úplnější popis [[https://www.sketchengine.co.uk/corpus-querying/|jazyka CQL]]. CQL je formální jazyk, jenž má přesnou (a konečnou) definici. CQL podporuje některé prvky tradičních [[pojmy:regularni_vyrazy|regulárních]] jazyků((Např. kvantifikátory, kulaté závorky a logické operátory.)), ale i rozšířené, specificky korpusové, příkazy jako je ''[[pojmy:within|within]]'', ''[[pojmy:meet|meet]]'', ''[[pojmy:union|union]]'' nebo ''[[pojmy:containing|containing]]'', které pracují se strukturou korpusu. |
viz podrobnější a úplnější popis jazyka CQL | |
CQL je formální jazyk, jenž má přesnou (a konečnou) definici. CQL podporuje některé prvky tradičních [[pojmy:regularni_vyrazy|regulárních]] jazyků((Např. kvantifikátory, kulaté závorky a logické operátory.)), ale i rozšířené, specificky korpusové, příkazy jako je ''[[pojmy:within|within]]'', ''[[pojmy:meet|meet]]'', ''[[pojmy:union|union]]'' nebo ''[[pojmy:containing|containing]]'', které pracují se strukturou korpusu. | |
| |
Dotaz na více pozic současně (tedy sekvenci slov či širší kontext) vznikne prostým zřetězením dotazů na jednotlivé po sobě následující pozice. Např. dotaz ''[lemma=<nowiki>"</nowiki>mít<nowiki>"</nowiki>][][lemma=<nowiki>"</nowiki>srdce<nowiki>"</nowiki>]'' hledá všechny výskyty lemmat //mít// a //srdce//, mezi nimiž se vyskytuje libovolná pozice (tj. slovo nebo interpunkce). | Dotaz na více pozic současně (tedy sekvenci slov či širší kontext) vznikne prostým zřetězením dotazů na jednotlivé po sobě následující pozice. Např. dotaz ''[lemma=<nowiki>"</nowiki>mít<nowiki>"</nowiki>][][lemma=<nowiki>"</nowiki>srdce<nowiki>"</nowiki>]'' hledá všechny výskyty lemmat //mít// a //srdce//, mezi nimiž se vyskytuje libovolná pozice (tj. slovo nebo interpunkce). |
| |
<WRAP round box 49%> | <WRAP round box 49%> |
[[pojmy:regularni_vyrazy|Regulární výrazy]] • [[kurz:pokrocile_dotazy|Kurz: Pokročilé dotazy]] • [[pojmy:atributy_pozicni|Poziční atributy]] • [[kurz:pokrocile_dotazy#co_v_korpusu_znamena_pozice|Co znamená pozice]] • [[http://trac.sketchengine.co.uk/wiki/SkE/CorpusQuerying|Corpus Querying at sketchengine.co.uk]] • [[pojmy:case-sensitive|Case-sensitive versus case-insensitive]] | [[pojmy:regularni_vyrazy|Regulární výrazy]] • [[kurz:pokrocile_dotazy|Kurz: Pokročilé dotazy]] • [[pojmy:atributy_pozicni|Poziční atributy]] • [[kurz:pokrocile_dotazy#co_v_korpusu_znamena_pozice|Co znamená pozice]] • [[https://www.sketchengine.co.uk/corpus-querying/|Corpus Querying at sketchengine.co.uk]] • [[pojmy:case-sensitive|Case-sensitive vs. case-insensitive]] |
</WRAP> | </WRAP> |
| |