Both sides previous revisionPrevious revision | Next revisionBoth sides next revision |
en:pojmy:dotazovaci_jazyk [2016/11/08 18:05] – veronikapojarova | en:pojmy:dotazovaci_jazyk [2016/11/08 18:09] – [Query language used in ČNK] veronikapojarova |
---|
A simultaneous query for more than one position (i.e. word sequence or wider context) is formed simply by the concatenation of the individual queries for each successive position. E.g. the query ''[lemma=<nowiki>"</nowiki>have<nowiki>"</nowiki>][][lemma=<nowiki>"</nowiki>heart<nowiki>"</nowiki>]'' searches for all occurrences of the lemmas //have// and //heart//, in between which there is one position (i.e. word or punctuation). | A simultaneous query for more than one position (i.e. word sequence or wider context) is formed simply by the concatenation of the individual queries for each successive position. E.g. the query ''[lemma=<nowiki>"</nowiki>have<nowiki>"</nowiki>][][lemma=<nowiki>"</nowiki>heart<nowiki>"</nowiki>]'' searches for all occurrences of the lemmas //have// and //heart//, in between which there is one position (i.e. word or punctuation). |
| |
Následující příklad dotazovacího jazyka korpusového manažeru Manatee najde všechny doklady spojení typu „bez chuti a bez zápachu“, „bez práce, bez peněz“ apod. vyskytující se v korpusu uvnitř jedné věty (struktura ''<s/>'', viz [[pojmy:atributy_strukturni|strukturní atributy]]): | The following example of the Manatee corpus manager's query language will find all instances of the construction type „neither woman nor man“, „neither man nor beast“ etc. occurring in the corpus within one sentence (structure''<s/>'', see [[en:pojmy:atributy_strukturni|structural attributes]]): |
| |
''[lemma=<nowiki>"</nowiki>bez<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] []{0,1} [lemma=<nowiki>"</nowiki>bez<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] within <s/>'' | ''[lemma=<nowiki>"</nowiki>neither<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] []{0,1} [lemma=<nowiki>"</nowiki>nor<nowiki>"</nowiki>] [tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>] within <s/>'' |
| |
Každou pozici v sekvenci zde zastupuje jedna hranatá závorka, případně doplněná kvantifikátorem ve složených závorkách. První pozici vyhovují všechna slova lemmatizovaná jako "bez", druhé pozici vyhovují všechna substantiva (tedy slovní tvary opatřené morfologikých tagem začínajícím písmenem "N" za nímž následuje libovolná sekvence libovolných znaků), třetí pozici vyhovuje libovolné jedno (či žádné) slovo, čtvrtá pozice je opět omezena lemmatem "bez", pátá opět pouze morfologickou značkou substantiva. Direktiva "within" omezuje celý dotaz na rámec jednoho strukturního atributu typu "<s/>" (tedy jedné věty). Pro tento účel lze využít též direktivu ''containing''. | Každou pozici v sekvenci zde zastupuje jedna hranatá závorka, případně doplněná kvantifikátorem ve složených závorkách. První pozici vyhovují všechna slova lemmatizovaná jako "bez", druhé pozici vyhovují všechna substantiva (tedy slovní tvary opatřené morfologikých tagem začínajícím písmenem "N" za nímž následuje libovolná sekvence libovolných znaků), třetí pozici vyhovuje libovolné jedno (či žádné) slovo, čtvrtá pozice je opět omezena lemmatem "bez", pátá opět pouze morfologickou značkou substantiva. Direktiva "within" omezuje celý dotaz na rámec jednoho strukturního atributu typu "<s/>" (tedy jedné věty). Pro tento účel lze využít též direktivu ''containing''. |