Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
pojmy:dotazovaci_jazyk [2016/03/19 18:10]
Michal Křen [Související odkazy]
pojmy:dotazovaci_jazyk [2016/03/19 18:22] (aktuální)
Michal Křen [Dotazovací jazyk užívaný v ČNK]
Řádek 7: Řádek 7:
 ====== Dotazovací jazyk užívaný v ČNK ====== ====== Dotazovací jazyk užívaný v ČNK ======
  
-Dotazovací jazyk užívaný v korpusech ČNK provozovaných na korpusovém manažeru [[pojmy:​korpusovy_manazer#​manatee|Manatee]] se nazývá **[[http://trac.sketchengine.co.uk/​wiki/SkE/CorpusQuerying|CQL (corpus query language)]]** a je jen mírně ​modifikovanou verzí původního jazyka CQL vytvořeného pro korpusový manažer [[pojmy:​korpusovy_manazer#​cwb|CWB]]. Jeho základním kamenem je dotaz na jednu pozici (slovo) v korpusu:+Dotazovací jazyk užívaný v korpusech ČNK provozovaných na korpusovém manažeru [[pojmy:​korpusovy_manazer#​manatee|Manatee]] se nazývá **[[https://www.sketchengine.co.uk/​corpus-querying/|CQL (corpus query language)]]** a je modifikovanou verzí původního jazyka CQL vytvořeného pro korpusový manažer [[pojmy:​korpusovy_manazer#​cwb|CWB]]. Jeho základním kamenem je dotaz na jednu pozici (slovo) v korpusu:
  
 ''​[atribut=<​nowiki>"</​nowiki>​hodnota<​nowiki>"</​nowiki>​]''​ ''​[atribut=<​nowiki>"</​nowiki>​hodnota<​nowiki>"</​nowiki>​]''​
  
-kde atributem se myslí [[pojmy:​atributy_pozicni|atribut poziční]] (word, lemma, tag apod.), hodnotou je pak hledaný výraz sám, nebo vzor specifikovaný pomocí [[pojmy:​regularni_vyrazy|regulárního výrazu]]. Součástí dotazu můžou být i omezení na [[pojmy:​atributy_strukturni|strukturní atributy]] (věta, doc, opus), u nichž je možné specifikovat i další hodnoty (např. u opusů rok vydání, žánr, autor apod.). Omezení na strukturní atributy se na rozdíl od omezení na atributy poziční uvádějí [[kurz:​zobrazeni_dotazu#​jak_vypada_tzv_vertikala|ve špičatých závorkách]] (např. ''<​s id=%%"​10"​%%/>''​);​ viz podrobnější a úplnější popis [[http://trac.sketchengine.co.uk/​wiki/SkE/​CorpusQuerying|jazyka CQL]]. CQL je formální jazyk, jenž má přesnou (a konečnou) definici. CQL podporuje některé prvky tradičních [[pojmy:​regularni_vyrazy|regulárních]] jazyků((Např. kvantifikátory,​ kulaté závorky a logické operátory.)),​ ale i rozšířené,​ specificky korpusové, příkazy jako je ''​[[pojmy:​within|within]]'',​ ''​[[pojmy:​meet|meet]]'',​ ''​[[pojmy:​union|union]]''​ nebo ''​[[pojmy:​containing|containing]]'',​ které pracují se strukturou korpusu.+kde atributem se myslí [[pojmy:​atributy_pozicni|atribut poziční]] (word, lemma, tag apod.), hodnotou je pak hledaný výraz sám, nebo vzor specifikovaný pomocí [[pojmy:​regularni_vyrazy|regulárního výrazu]]. Součástí dotazu můžou být i omezení na [[pojmy:​atributy_strukturni|strukturní atributy]] (věta, doc, opus), u nichž je možné specifikovat i další hodnoty (např. u opusů rok vydání, žánr, autor apod.). Omezení na strukturní atributy se na rozdíl od omezení na atributy poziční uvádějí [[kurz:​zobrazeni_dotazu#​jak_vypada_tzv_vertikala|ve špičatých závorkách]] (např. ''<​s id=%%"​10"​%%/>''​);​ viz podrobnější a úplnější popis [[https://www.sketchengine.co.uk/​corpus-querying/|jazyka CQL]]. CQL je formální jazyk, jenž má přesnou (a konečnou) definici. CQL podporuje některé prvky tradičních [[pojmy:​regularni_vyrazy|regulárních]] jazyků((Např. kvantifikátory,​ kulaté závorky a logické operátory.)),​ ale i rozšířené,​ specificky korpusové, příkazy jako je ''​[[pojmy:​within|within]]'',​ ''​[[pojmy:​meet|meet]]'',​ ''​[[pojmy:​union|union]]''​ nebo ''​[[pojmy:​containing|containing]]'',​ které pracují se strukturou korpusu.
  
 Dotaz na více pozic současně (tedy sekvenci slov či širší kontext) vznikne prostým zřetězením dotazů na jednotlivé po sobě následující pozice. Např. dotaz ''​[lemma=<​nowiki>"</​nowiki>​mít<​nowiki>"</​nowiki>​][][lemma=<​nowiki>"</​nowiki>​srdce<​nowiki>"</​nowiki>​]''​ hledá všechny výskyty lemmat //mít// a //srdce//, mezi nimiž se vyskytuje libovolná pozice (tj. slovo nebo interpunkce). Dotaz na více pozic současně (tedy sekvenci slov či širší kontext) vznikne prostým zřetězením dotazů na jednotlivé po sobě následující pozice. Např. dotaz ''​[lemma=<​nowiki>"</​nowiki>​mít<​nowiki>"</​nowiki>​][][lemma=<​nowiki>"</​nowiki>​srdce<​nowiki>"</​nowiki>​]''​ hledá všechny výskyty lemmat //mít// a //srdce//, mezi nimiž se vyskytuje libovolná pozice (tj. slovo nebo interpunkce).