Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
kurz:prvni_dotaz [2021/03/02 19:35] – [Vyzkoušejte si na závěr] dominikakovarikova | kurz:prvni_dotaz [2021/03/08 10:31] (aktuální) – [Jak citovat korpus] vaclavcvrcek |
---|
V úvodní lekci se naučíme zadávat do korpusu dotazy a vysvětlíme si, v čem se liší jejich různé typy. Na závěr si ještě ukážeme, jak korpusy citovat. | V úvodní lekci se naučíme zadávat do korpusu dotazy a vysvětlíme si, v čem se liší jejich různé typy. Na závěr si ještě ukážeme, jak korpusy citovat. |
| |
Rozhraní **KonText** spustíme odkazem na horní liště portálu [[https://www.korpus.cz|www.korpus.cz]] nebo přímo, zadáním adresy [[https://kontext.korpus.cz]]. K plnohodnotné práci s rozhraním je nezbytné se [[kurz:zaciname|zaregistrovat a přihlásit se k svému účtu]]. První dotaz napíšeme ho do prázdného dotazovacího řádku. | Rozhraní **KonText** spustíme odkazem na horní liště portálu [[https://www.korpus.cz|www.korpus.cz]] nebo přímo, zadáním adresy [[https://www.korpus.cz/kontext]]. K plnohodnotné práci s rozhraním je nezbytné se [[kurz:zaciname|zaregistrovat a přihlásit se k svému účtu]]. První dotaz napíšeme do prázdného dotazovacího řádku. |
| |
[{{:kurz:zakladnidotaz.png?500|Zadání nového dotazu do [[manualy:kontext:index|rozhraní KonText]] FIXME }}]\\ | |
| |
===== Výchozí nastavení ===== | ===== Výchozí nastavení ===== |
</WRAP> | </WRAP> |
| |
[{{:kurz:kuriozita_kontext.png?700|Konkordance slova //kuriozita//. }}] | [{{:kurz:kuriozita_kontext.png?direct&700|Konkordance slova //kuriozita//. }}] |
| |
<WRAP clear/> | <WRAP clear/> |
| |
\\ | \\ |
Funguje vám vyhledávání? Ověřte si výsledky v korpusu SYN2015: | Funguje vám vyhledávání? Ověřte si výsledky v korpusu SYN2020: |
| |
^ Dotaz ^ Počet výskytů ^ Relativní frekvence ([[pojmy:ipm|i.p.m.]]) ^ | ^ Dotaz ^ Počet výskytů ^ Relativní frekvence ([[pojmy:ipm|i.p.m.]]) ^ |
===== Typy dotazů ===== | ===== Typy dotazů ===== |
| |
FIXME | |
V rozhraní KonText rozlišujeme mezi dvěma základními typy dotazů: | V rozhraní KonText rozlišujeme mezi dvěma základními typy dotazů: |
| |
Výchozím nastavením je **jednoduchý dotaz**, v němž je dále implicitně nastaveno nerozlišování velikosti písmen (přepínač Shoda velikosti písmen je vypnutý), není povoleno použití regulárních výrazů (přepínač Povolit regulární výrazy je vypnutý) a vyhledávání je nastaveno podle výchozího atributu lemma|word (v SYN2020 lemma|sublemma|word), čímž se vyhledá nejen uvedený tvar (podle atributu word), ale i další tvary slova (podle atributů lemma nebo sublemma), pokud je zadaný tvar zároveň lemmatem nebo sublemmatem (poznámka: oproti předchozím verzím KonTextu nejde o změnu, jen o zobecnění chování původního základního dotazu). Do vstupního řádku je možné kromě jednotlivých slov zadávat i celé fráze. Vyhledávání lze na jednotlivých pozicích upřesnit jednak pomocí [[manualy:kontext:novy_dotaz#naseptavac|našeptávače]], jednak změnou výchozího atributu (atribut je pak platný pro všechny pozice) a/nebo přepnutím shody velikosti písmen. Složitější dotazy je možné pokládat i v rámci jednoduchého dotazu, pokud uživatel využije volby Povolit regulární výrazy. | Výchozím nastavením je **jednoduchý dotaz**, v němž je dále implicitně nastaveno nerozlišování velikosti písmen (přepínač Shoda velikosti písmen je vypnutý), není povoleno použití regulárních výrazů (přepínač Povolit regulární výrazy je vypnutý) a vyhledávání je nastaveno podle výchozího atributu ''lemma|word'' (v SYN2020 ''lemma|sublemma|word''), čímž se vyhledá nejen uvedený tvar (podle atributu word), ale i další tvary slova (podle atributů lemma nebo sublemma), pokud je zadaný tvar zároveň lemmatem nebo sublemmatem (poznámka: oproti předchozím verzím KonTextu nejde o změnu, jen o zobecnění chování původního základního dotazu). Do vstupního řádku je možné kromě jednotlivých slov zadávat i celé fráze. Vyhledávání lze na jednotlivých pozicích upřesnit jednak pomocí [[manualy:kontext:novy_dotaz#naseptavac|našeptávače]], jednak změnou výchozího atributu (atribut je pak platný pro všechny pozice) a/nebo přepnutím shody velikosti písmen. Složitější dotazy je možné pokládat i v rámci jednoduchého dotazu, pokud uživatel využije volby Povolit regulární výrazy. |
| |
**Pokročilý dotaz** se aktivuje spínačem nad vstupním řádkem a plně odpovídá dotazu typu CQL předchozích verzí KonTextu. Při zadávání dotazovacího jazyka CQL KonText automaticky kontroluje a zvýrazňuje syntax dotazu. V případě, že dotaz není validní, KonText na to uživatele upozorní a umožní mu dotaz před vyhodnocením opravit. Vzhledem k širokým možnostem CQL dotazování však není kontrola správnosti dotazu vždy přesná, výjimečně se tak může stát, že se varování objeví i v případě validního dotazu. | **Pokročilý dotaz** se aktivuje spínačem nad vstupním řádkem a plně odpovídá dotazu typu CQL předchozích verzí KonTextu. Při zadávání dotazovacího jazyka CQL KonText automaticky kontroluje a zvýrazňuje syntax dotazu. V případě, že dotaz není validní, KonText na to uživatele upozorní a umožní mu dotaz před vyhodnocením opravit. Vzhledem k širokým možnostem CQL dotazování však není kontrola správnosti dotazu vždy přesná, výjimečně se tak může stát, že se varování objeví i v případě validního dotazu. |
===== Jak citovat korpus ===== | ===== Jak citovat korpus ===== |
| |
[{{ :kurz:jak_citovat_korpus.png?300|Zobrazení základních informací o korpusu a jeho bibliografické citace. }}] | [{{ :kurz:jak_citovat_korpus.png?direct&300|Zobrazení základních informací o korpusu a jeho bibliografické citace. }}] |
| |
Pokud ve svém lingvistickém (či jiném) výzkumu používáte některý z [[cnk:uvod|korpusů ČNK]], je třeba ho citovat v seznamu literatury. Pádných důvodů k tomu je hned několik: | Pokud ve svém lingvistickém (či jiném) výzkumu používáte některý z [[cnk:uvod|korpusů ČNK]], je třeba ho citovat v seznamu literatury. Pádných důvodů k tomu je hned několik: |
| |
- Každý výzkum by měl být replikovatelný, tedy ověřitelný dalšími badateli. V případě [[pojmy:referencni|korpusů referenčních]], jako je např. [[cnk:syn2020|SYN2020]] nebo [[cnk:oral2013|ORAL2013]], lze stejným dotazem vždy dojít ke stejnému výsledku, tedy i ověřit závěry vyvozené z jakéhokoli předchozího výzkumu. U korpusů verzovaných (např. [[cnk:syn|SYN]], [[cnk:intercorp|InterCorp]], [[cnk:diakorp|DIAKORP]]), které s každou novou verzí rostou, je třeba dodat také informaci o verzi. | - Každý výzkum by měl být replikovatelný, tedy ověřitelný dalšími badateli. V případě [[pojmy:referencni|korpusů referenčních]], jako je např. [[cnk:syn2020|SYN2020]] nebo [[cnk:oral2013|ORAL2013]], lze stejným dotazem vždy dojít ke stejnému výsledku, tedy i ověřit závěry vyvozené z jakéhokoli předchozího výzkumu. U korpusů verzovaných (např. [[cnk:syn|SYN]], [[cnk:intercorp|InterCorp]], [[cnk:diakorp|DIAKORP]], [[cnk:online|ONLINE]]), které s každou novou verzí rostou, je třeba dodat také informaci o verzi, příp. o datu zveřejnění. |
- Bez údaje o tom, v kterém z korpusů ČNK byl daný jev vyhledán, nemůže být jeho analýza úplná. U většiny jevů totiž zcela zásadně záleží na velikosti korpusu (viz např. [[pojmy:typ#pomer_poctu_typu_a_tokenu|TTR]]), ale i na tom, o jaký typ dat jde (např. data psaná vs. mluvená). | - Bez údaje o tom, v kterém z korpusů ČNK byl daný jev vyhledán, nemůže být jeho analýza úplná. U většiny jevů totiž zcela zásadně záleží na velikosti korpusu (viz např. [[pojmy:typ#pomer_poctu_typu_a_tokenu|TTR]]), ale i na tom, o jaký typ dat jde (např. data psaná vs. mluvená). |
- Korpusy ČNK jsou zahrnuty v [[https://www.rvvi.cz/riv|RIV]] a na základě toho je třeba je citovat jako jakékoli jiné akademické dílo. | - Korpusy ČNK jsou zahrnuty v [[https://www.rvvi.cz/riv|RIV]] a na základě toho je třeba je citovat jako jakékoli jiné akademické dílo. |