Both sides previous revisionPrevious revisionNext revision | Previous revision |
en:pojmy:dotazovaci_jazyk [2016/11/08 18:09] – [Query language used in ČNK] veronikapojarova | en:pojmy:dotazovaci_jazyk [2020/12/21 19:05] (current) – [Query language used in ČNK] michalkren |
---|
====== Query language used in ČNK ====== | ====== Query language used in ČNK ====== |
| |
The query language used in the ČNK corpora operating on the corpus manager [[en:pojmy:korpusovy_manazer#manatee|Manatee]] is called **[[https://www.sketchengine.co.uk/corpus-querying/|CQL (corpus query language)]]** and is in fact a modified version of the original CQL created for the corpus manager [[en:pojmy:korpusovy_manazer#cwb|CWB]]. Its cornerstone is a query for a single position (word) in the corpus: | The query language used in the ČNK corpora operating on the corpus manager [[en:pojmy:korpusovy_manazer#manatee|Manatee]] is called **[[https://www.sketchengine.eu/documentation/corpus-querying/|CQL (corpus query language)]]** and is in fact a modified version of the original CQL created for the corpus manager [[en:pojmy:korpusovy_manazer#cwb|CWB]]. Its cornerstone is a query for a single position (word) in the corpus: |
| |
''[attribute=<nowiki>"</nowiki>value<nowiki>"</nowiki>]'' | ''[attribute=<nowiki>"</nowiki>value<nowiki>"</nowiki>]'' |
''[lemma=<nowiki>"</nowiki>neither<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] []{0,1} [lemma=<nowiki>"</nowiki>nor<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] within <s/>'' | ''[lemma=<nowiki>"</nowiki>neither<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] []{0,1} [lemma=<nowiki>"</nowiki>nor<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] within <s/>'' |
| |
Každou pozici v sekvenci zde zastupuje jedna hranatá závorka, případně doplněná kvantifikátorem ve složených závorkách. První pozici vyhovují všechna slova lemmatizovaná jako "bez", druhé pozici vyhovují všechna substantiva (tedy slovní tvary opatřené morfologikých tagem začínajícím písmenem "N" za nímž následuje libovolná sekvence libovolných znaků), třetí pozici vyhovuje libovolné jedno (či žádné) slovo, čtvrtá pozice je opět omezena lemmatem "bez", pátá opět pouze morfologickou značkou substantiva. Direktiva "within" omezuje celý dotaz na rámec jednoho strukturního atributu typu "<s/>" (tedy jedné věty). Pro tento účel lze využít též direktivu ''containing''. | Each position in the sequence is represented by one pair of square brackets, possibly accompanied by a quantifier in curly brackets. The first position represents all words lemmatized as "neither", the second position represents all nouns (word forms containing a morphological tag beginning with the letter "N", followed by an arbitrary sequence of arbitrary characters), the third position is occupied by any one word (or none), the fourth position is limited to the lemma "nor", and the fifth position once again contains the morphological tag for nouns. The directive "within" limits the entire query within the scope of one structural attribute "<s/>" (i.e. one sentence). It is also possible to use the directive ''containing'' for this particular purpose. |
| |
Při práci s korpusovým manažerem je vhodné znát použitý dotazovací jazyk a jeho možnosti. Ačkoli některá uživatelská rozhraní umožňují zadávat dotaz i bez znalosti konkrétního dotazovacího jazyka, bývají v tomto případě možnosti práce s korpusem omezeny, což je dáno snahou o uživatelský komfort a srozumitelnost rozhraní, která je vždy na úkor plného využití bohatých kombinací možností vyhledávání. | For work with a corpus manager it is advisable to know the query language used and the possibilities it offers. Although some user interfaces make it possible to input queries without knowledge of the specific query language, the possibilities of working with such an interface tend to be somewhat limited. This is a result of the effort to make the interface user-friendly and as comprehensible as possible, which is always achieved at the expense of the possibilities and combinations available to the user. |
| |
==== Relevant links ==== | ==== Relevant links ==== |