Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
kurz:pokrocile_dotazy [2021/03/23 10:50] – [Shoda (a neshoda) atributů] vaclavcvrcek | kurz:pokrocile_dotazy [2023/11/06 14:38] (aktuální) – [Posloupnost pozic] kovarikova |
---|
===== Posloupnost pozic ===== | ===== Posloupnost pozic ===== |
| |
Jedny hranaté závorky s atributem a jeho hodnotou odpovídají v CQL jedné pozici v textu. Pokud za sebou v CQL zapíšeme dvoje hranaté závorky za sebou, vyhledají se (samozřejmě podle zadaných podmínek) dvě pozice v textu bezprostředně následující za sebou. Můžeme například vyhledat spojení //zelené jablko//, a to prostřednictvím dotazu ''[word=<nowiki>"</nowiki>zelené<nowiki>"</nowiki>][word=<nowiki>"</nowiki>jablko<nowiki>"</nowiki>]''. Podobně můžeme vyhledat i větší množství slov následujících za sebou v textu, např. dotaz ''[lemma=<nowiki>"</nowiki>od<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>ráno<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>do<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>večer<nowiki>"</nowiki>]'' v korpusu [[cnk:syn2020|SYN2020]] vyhledá [[https://www.korpus.cz/kontext/view?maincorp=syn2020&viewmode=kwic&pagesize=40&attrs=word%2Clemma%2Ctag%2Cverbtag&attr_vmode=mouseover&base_viewattr=word&structs=s&refs=%3Ddoc.title&q=~00EyK46kk0kc|415 výskytů]] fráze //od/Od rána do večera//, dotaz ''[lemma=<nowiki>"</nowiki>rozhodnout<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>se<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>,<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>že<nowiki>"</nowiki>]'' [[https://www.korpus.cz/kontext/view?maincorp=syn2020&viewmode=kwic&pagesize=40&attrs=word%2Clemma%2Ctag%2Cverbtag&attr_vmode=mouseover&base_viewattr=word&structs=s&refs=%3Ddoc.title&q=~Tq24E8MC8GQW|přes 1100 výskytů]] spojení slov //rozhodnout se, že// v různých tvarech. Atributy v jednotlivých pozicích se samozřejmě můžou lišit, např. dotaz ''[pos=<nowiki>"</nowiki>V<nowiki>"</nowiki>][word=<nowiki>"</nowiki>,<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>že<nowiki>"</nowiki>]'' vyhledá slovesa, která předcházejí spojce //že//. | Jedny hranaté závorky s atributem a jeho hodnotou odpovídají v CQL jedné pozici v textu. Pokud za sebou v CQL zapíšeme dvoje hranaté závorky za sebou, vyhledají se (samozřejmě podle zadaných podmínek) dvě pozice v textu bezprostředně následující za sebou. Můžeme například vyhledat spojení //zelené jablko//, a to prostřednictvím dotazu ''[word=<nowiki>"</nowiki>zelené<nowiki>"</nowiki>][word=<nowiki>"</nowiki>jablko<nowiki>"</nowiki>]''. Podobně můžeme vyhledat i větší množství slov následujících za sebou v textu, např. dotaz ''[lemma=<nowiki>"</nowiki>od<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>ráno<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>do<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>večer<nowiki>"</nowiki>]'' v korpusu [[cnk:syn2020|SYN2020]] vyhledá [[https://www.korpus.cz/kontext/view?viewmode=kwic&pagesize=50&attrs=word&attrs=verbtag&attr_vmode=visible-kwic&base_viewattr=word&refs=%3Ddoc.title&refs=%3Ddoc.txtype&q=~jG2yEO4SqMks&cutoff=0|415 výskytů]] fráze //od/Od rána do večera//, dotaz ''[lemma=<nowiki>"</nowiki>rozhodnout<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>se<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>,<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>že<nowiki>"</nowiki>]'' [[https://www.korpus.cz/kontext/view?viewmode=kwic&pagesize=50&attrs=word&attrs=verbtag&attr_vmode=visible-kwic&base_viewattr=word&refs=%3Ddoc.title&refs=%3Ddoc.txtype&q=~Nw2kemaeAoUY&cutoff=0|přes 1100 výskytů]] spojení slov //rozhodnout se, že// v různých tvarech. Atributy v jednotlivých pozicích se samozřejmě můžou lišit, např. dotaz ''[pos=<nowiki>"</nowiki>V<nowiki>"</nowiki>][word=<nowiki>"</nowiki>,<nowiki>"</nowiki>][lemma=<nowiki>"</nowiki>že<nowiki>"</nowiki>]'' vyhledá slovesa, která předcházejí spojce //že//. |
| |
Nyní si ukážeme počítání pozic **včetně interpunkce** (i ta tvoří v korpusech samostatné pozice) ještě na konkrétním dotazu, v němž jde o publicistické užití a aktualizace přísloví //vlk se nažral a koza zůstala celá//: | Nyní si ukážeme počítání pozic **včetně interpunkce** (i ta tvoří v korpusech samostatné pozice) ještě na konkrétním dotazu, v němž jde o publicistické užití a aktualizace přísloví //vlk se nažral a koza zůstala celá//: |
| |
<WRAP round help 60%> | <WRAP round help 60%> |
* Zkuste zformulovat dotaz, jímž ověříte ne/existující aktualizace přísloví //těžko na cvičišti, lehko na bojišti// v korpusech [[cnk:syn2015|SYN2015]] a [[cnk:syn2013pub|SYN2013PUB]]. | * Zkuste zformulovat dotaz, jímž ověříte ne/existující aktualizace přísloví //těžko na cvičišti, lehko na bojišti// v korpusech [[cnk:syn2020|SYN2020]] a [[cnk:syn2013pub|SYN2013PUB]]. |
* A z jiného soudku: Nadávek odvozených od německého //Herr Gott// je nemálo (např. //hergot//, //herdek//, //hernajs// a jistě vymyslíte další). Vyhledejte co nejvíc takovýchto odvozenin v korpusu [[cnk:oral2013|ORAL2013]] a zjistěte, zda se jejich užití liší podle regionů. | * A z jiného soudku: Nadávek odvozených od německého //Herr Gott// je nemálo (např. //hergot//, //herdek//, //hernajs// a jistě vymyslíte další). Vyhledejte co nejvíc takovýchto odvozenin v korpusu [[cnk:oral2013|ORAL2013]] a zjistěte, zda se jejich užití liší podle regionů. |
| |