Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
kurz:prvni_dotaz [2018/08/08 16:47] – jankocek | kurz:prvni_dotaz [2021/03/08 10:31] (aktuální) – [Jak citovat korpus] vaclavcvrcek |
---|
V úvodní lekci se naučíme zadávat do korpusu dotazy a vysvětlíme si, v čem se liší jejich různé typy. Na závěr si ještě ukážeme, jak korpusy citovat. | V úvodní lekci se naučíme zadávat do korpusu dotazy a vysvětlíme si, v čem se liší jejich různé typy. Na závěr si ještě ukážeme, jak korpusy citovat. |
| |
Rozhraní **KonText** spustíme odkazem na horní liště portálu [[https://www.korpus.cz|www.korpus.cz]] nebo přímo, zadáním adresy [[https://kontext.korpus.cz]]. První dotaz zadáme po [[kurz:zaciname|registraci a přihlášení]], píšeme ho do prázdného řádku s názvem **Dotaz**. | Rozhraní **KonText** spustíme odkazem na horní liště portálu [[https://www.korpus.cz|www.korpus.cz]] nebo přímo, zadáním adresy [[https://www.korpus.cz/kontext]]. K plnohodnotné práci s rozhraním je nezbytné se [[kurz:zaciname|zaregistrovat a přihlásit se k svému účtu]]. První dotaz napíšeme do prázdného dotazovacího řádku. |
| |
[{{:kurz:zakladnidotaz.png?500|Zadání nového dotazu do [[manualy:kontext:index|rozhraní KonText]] }}] | |
===== Výchozí nastavení ===== | ===== Výchozí nastavení ===== |
| |
Hledání je ve [[manualy:kontext:novy_dotaz|formuláři pro zadávání nového dotazu]] automaticky přednastaveno na nejnovější referenční vyvážený korpus (my ale budeme často pracovat i se starším korpusem [[cnk:syn2010|SYN2010]]) a jako výchozí (defaultní) je nastaven typ dotazu zvaný //základní//. Korpus, s kterým pracujete, je vždy uveden v levém horním rohu pod logem rozhraní, kde se nachází tzv. //drobečková navigace//, zaznamenávající průběh manipulace s dotazem; pokud kliknete na název korpusu, dostanete se k podrobnějším informacím o něm včetně toho, jak zvolený korpus [[cnk:citace|citovat]]. | Hledání je ve [[manualy:kontext:novy_dotaz|formuláři pro zadávání nového dotazu]] automaticky přednastaveno na nejnovější referenční vyvážený korpus, tj. [[cnk:syn2020|SYN2020]] (my ale budeme často pracovat i se staršími korpusy) a jako výchozí (defaultní) je nastaven jednoduchý typ dotazu. Korpus, s kterým pracujete, je vždy uveden v levém horním rohu pod logem rozhraní, kde se nachází tzv. //drobečková navigace//, zaznamenávající průběh manipulace s dotazem; pokud kliknete na název korpusu, dostanete se k podrobnějším informacím o něm včetně toho, jak zvolený korpus [[cnk:citace|citovat]]. |
| |
Do dotazovacího řádku v [[manualy:kontext:index|rozhraní KonText]] můžete napsat jakékoli slovo či kombinaci slov a sledovat, kolikrát se v daném korpusu vyskytuje. (Je dobré mít na paměti, že pro [[pojmy:korpusovy_manazer|korpusový manažer]] je slovo pouhým řetězcem alfabetických znaků a že umí vyhledávat i znaky jiné povahy, např. číslice či [[pojmy:regularni_vyrazy|regulární výrazy]].) | Do dotazovacího řádku v [[manualy:kontext:index|rozhraní KonText]] můžete napsat jakékoli slovo či kombinaci slov a sledovat, kolikrát se v daném korpusu vyskytuje. (Je dobré mít na paměti, že pro [[pojmy:korpusovy_manazer|korpusový manažer]] je slovo pouhým řetězcem alfabetických znaků a že umí vyhledávat i znaky jiné povahy, např. číslice či [[pojmy:regularni_vyrazy|regulární výrazy]].) |
| |
<WRAP round help 40%> | <WRAP round help 40%> |
**Zkuste si v korpusu SYN2015 najít třeba** | **Zkuste si v korpusu SYN2020 najít třeba** |
- své jméno, případně příjmení | - své jméno, případně příjmení |
- otazník -- //?// (tj. tázací věty) či vykřičník -- //!// | - otazník -- //?// (tj. tázací věty) či vykřičník -- //!// (tedy mj. věty zvolací) |
- nějakou kuriozitu | - nějakou kuriozitu |
* třeba přímo slovo //kuriozita// | * třeba přímo slovo //kuriozita// |
</WRAP> | </WRAP> |
| |
[{{:kurz:kuriozita_kontext.png?700|Konkordance slova //kuriozita//. }}] | [{{:kurz:kuriozita_kontext.png?direct&700|Konkordance slova //kuriozita//. }}] |
| |
<WRAP clear/> | <WRAP clear/> |
| |
| \\ |
Funguje vám vyhledávání? Ověřte si výsledky (korpus: SYN2015, typ dotazu: základní): | Funguje vám vyhledávání? Ověřte si výsledky v korpusu SYN2020: |
| |
^ Dotaz ^ Počet výskytů ^ Relativní frekvence ([[pojmy:ipm|i.p.m.]]) ^ | ^ Dotaz ^ Počet výskytů ^ Relativní frekvence ([[pojmy:ipm|i.p.m.]]) ^ |
| ''kuriozita'' | 467 | 3,87 | | | ''kuriozita'' | 456 | 3,74 | |
| ''?'' | 483 771 | 4006,43 | | | ''?'' | 493 417 | 4050,15 | |
| ''cmunda'' | 6 | 0,05 | | | ''!'' | 179 982 | 1477,36 | |
| ''eklovat'' | 9 | 0,07 | | | ''cmunda'' | 9 | 0,07 | |
| | ''eklovat'' | 6 | 0,05 | |
| ''eklovat se'' | 1 | 0,01 | | | ''eklovat se'' | 1 | 0,01 | |
| |
Můžeme si všimnout, že v korpusu [[cnk:syn2015|SYN2015]], který obsahuje zhruba sto milionů [[pojmy:pozice|pozic]], má jeden výskyt určitého výrazu (např. kombinace //eklovat se//) relativní [[pojmy:frekvence|frekvenci]] 0,01 výskytů na milion. Proč to stojí za povšimnutí? Relativní frekvence je velmi důležitá při srovnávání výsledků z různě velkých korpusů (10 výskytů ve stomilionovém korpusu neznamená stejnou četnost jako 10 výskytů v korpusu miliardovém). | Můžeme si všimnout, že v korpusu [[cnk:syn2020|SYN2020]], který obsahuje zhruba sto milionů [[pojmy:pozice|pozic]], má jeden výskyt určitého výrazu (např. kombinace //eklovat se//) relativní [[pojmy:frekvence|frekvenci]] 0,01 výskytů na milion. Proč to stojí za povšimnutí? Relativní frekvence je velmi důležitá při srovnávání výsledků z různě velkých korpusů (10 výskytů ve stomilionovém korpusu neznamená stejnou četnost jako 10 výskytů v korpusu miliardovém). |
| |
A ještě jedna věc: vyhledanému výrazu či kombinaci výrazů -- v našem rozhraní <fc #e2007a>**růžově zvýrazněnému**</fc> -- se říká [[pojmy:kwic|KWIC]]; tato zkratka pochází z anglického //key word in context// (klíčové slovo v kontextu). Celému řádku se říká konkordanční řádek, ten je součástí [[pojmy:konkordance|konkordance]] (seznamu všech konkordančních řádků, tedy všech výskytů hledaného výrazu spolu s jejich kontexty). | A ještě jedna věc: vyhledanému výrazu či kombinaci výrazů -- v našem rozhraní <fc #e2007a>**růžově zvýrazněnému**</fc> -- se říká [[pojmy:kwic|KWIC]]; tato zkratka pochází z anglického //key word in context// (klíčové slovo v kontextu). Celému řádku se říká konkordanční řádek, ten je součástí [[pojmy:konkordance|konkordance]] (seznamu všech konkordančních řádků, tedy všech výskytů hledaného výrazu spolu s jejich kontexty). |
| |
===== Jak přejít na nový dotaz ===== | ===== Jak přejít na nový dotaz ===== |
| |
===== Typy dotazů ===== | ===== Typy dotazů ===== |
| |
Celkem je v rozhraní KonText k dispozici 6 typů dotazů (základní, lemma, fráze, slovní tvar, část slova, CQL), každý z nich je vhodný na jiný typ zkoumání. Je však třeba mít na paměti, že ne ve všech korpusech můžeme hledat pomocí všech typů dotazů (např. v některém nelemmatizovaném korpusu [[pojmy:mluveny#ceske_korpusy_mluveneho_jazyka|z řady ORAL]] chybí z pochopitelných důvodů typ dotazu //lemma//). | V rozhraní KonText rozlišujeme mezi dvěma základními typy dotazů: |
| |
==== Typ dotazu: Slovní tvar (word) ==== | |
| |
Z hlediska výkladu je nejjednodušším typem dotazu //slovní tvar// (angl. //[[pojmy:word|word]]//). S jeho pomocí nacházíme v korpusu přesnou shodu, tj. daný tvar v podobě, v jaké byl zadán. Dotazu na slovní tvar ''pes'' tak odpovídá pouze tvar //pes//, dotazu ''koček'' odpovídá pouze tvar //koček//. | |
| |
Jedinou odlišností mezi dotazem a výsledkem může být velikost písmen. Ve výchozím nastavení je dotaz na slovní tvar [[pojmy:case-insensitive|case-insensitive]], což znamená, že hledá zadaný tvar bez ohledu na velikost písmen (dotazu ''londýně'' nebo ''Londýně'' odpovídají tvary //Londýně//, //londýně// ale i třeba //LONDÝNĚ//). Citlivost k velikosti písmen lze při zadání dotazu ovlivnit pomocí volby **Shoda velikosti písmen** pod dotazovacím řádkem. | |
| |
<wrap lo>V syntaxi [[pojmy:dotazovaci_jazyk|CQL]] odpovídá tento typ dotazu následujícímu výrazu: ''[word=<nowiki>"</nowiki>pes<nowiki>"</nowiki>]'' příp. ''[word=<nowiki>"</nowiki>(?i)pes<nowiki>"</nowiki>]''.</wrap> | |
==== Typ dotazu: Lemma ==== | |
| |
Dalším typem dotazu je [[pojmy:lemma|lemma]]. Tímto termínem se označuje základní tvar pro nějaký výraz (chápaný také jako reprezentant celého paradigmatu). Většinou právě lemma hledáme ve slovníku (např. místo slovního tvaru //chytrého// hledáme ve slovníku //chytrý//). Do značné míry je dáno tradicí, např. u substantiv lemmatem zpravidla bývá 1. pád jednotného čísla. Zde je orientační přehled tvarů lemmatu pro různé slovní druhy: | |
| |
^ Slovní druh ^ základní tvar ^ lemma ^ příklady slovních tvarů pod ně spadajících ^ | |
^ substantiva | nom. sg. | //les// | //lesům, lesy, lesích// | | |
^ adjektiva | nom. sg. mask., nestupňovaný tvar (pozitiv) ((Pozor: většinou (nikoli však ve všech případech) je základním tvarem adjektivum bez negace, tedy afirmativní.)) | //chytrý// | //chytrého, nejchytřejším, chytrejma// | | |
^ verba | infinitiv, bez negace | //chodit// | //chodil, chodíš, nechodíme// | | |
^ adverbia | nestupňovaný tvar (pozitiv) | //černě// | //černěji, nejčerněji// | | |
^ zájmena | nom. sg. mask. ((Pozor: lemma //to// je vyhrazeno částicím.)) | //ten// | //to, ta, ti// | | |
^ číslovky | nom. sg. mask. | //osmý// | //osmá, osmou// | | |
^ ostatní slovní druhy | lemma = tvar (malými písmeny) | //ať// | //ať//, //Ať//, //AŤ// | | |
| |
Zadáme-li tedy jako typ dotazu //lemma// výraz ''pes'', najdeme všechny výskyty všech slovních tvarů tohoto slova bez ohledu na velikost písmen (//pes, psy, psem, psovi..., Pes, PSY, PseM...//). | |
| |
<wrap lo>V syntaxi [[pojmy:dotazovaci_jazyk|CQL]] odpovídá tento typ dotazu následujícímu výrazu: ''[lemma=<nowiki>"</nowiki>les<nowiki>"</nowiki>]''.</wrap> | |
| |
<WRAP round important 68%> | |
Při zadávání dotazu typu lemma je třeba vědět, že velikost písmen tu má trochu jinou funkci než u slovního tvaru. Lemmata obecných jmen (apelativ) se píší malými písmeny, počáteční velké písmeno mají pouze jména vlastní (propria), příp. zkratky. V korpusu tak můžou existovat lemmata lišící se pouze velikostí písmen (např. ''hrad'' a ''Hrad'', z nichž jedno označuje apelativní užití a druhé propriální). | |
</WRAP> | |
==== Typ dotazu: Základní ==== | |
| |
Základní dotaz slouží pro potřeby rychlého informativního hledání v situacích, které nevyžadují přílišnou přesnost (v mnoha směrech je tak analogický hledání v běžných internetových vyhledávačích, např. Google). Princip základního dotazu pak spočívá v tom, že je-li zadán základní slovníkový tvar (lemma), vyhledají se také všechny jeho tvary; pokud se o lemma nejedná, vyhledají se jenom ty tvary, které se s dotazem přesně shodují. Základní dotaz by se tedy dal popsat zhruba touto instrukcí korpusovému manažeru: hledej zadané slovo jako [[pojmy:case-insensitive|case-insensitive]] tvar, a pokud zadané slovo existuje i jako lemma, přidej výskyty tohoto lemmatu do výsledku. | |
| |
<wrap lo>V syntaxi [[pojmy:dotazovaci_jazyk|CQL]] je možné tento typ dotazu zapsat jako ''[word=<nowiki>"(?i)les"|lemma="les"</nowiki>]''.</wrap> | |
| |
<WRAP round info 68%> | |
V korpusu [[cnk:syn2015|SYN2015]] u **základního** typu dotazu má slovo //zdraví// 10 355 výskytů a u dotazu typu **lemma** jen 10 143 výskytů. Je to dáno tím, že ne ve všech případech je tvar //zdraví// substantivem: kromě toho může být slovesem (//Teď je na řadě bodrý úsměv, jakým se zdraví staří známí.//) anebo adjektivem (//A proste, abyste byli stále zdraví, byť bez slávy Boží.//) | |
</WRAP> | |
==== Typ dotazu: Fráze ==== | |
| |
Typ dotazu //fráze// slouží zejména k hledání víceslovných výrazů; dotazy typu //slovní tvar// ani //lemma// totiž neumožňují zadat víc slov najednou. V tom je //fráze// podobná i //základnímu// dotazu, je v nich ale přeci jen rozdíl. Zkusme nyní v korpusu SYN2015 zadat dvojici sousloví v jejich základních tvarech, lemmatech -- ''prašivý pes'' a ''černý kočka'': | |
| |
^ Typ dotazu ^ ''černý kočka'' ^ ''prašivý pes'' ^ | |
^ Základní | najde celé paradigma (//černá kočka, černé kočky// atd.) | najde celé paradigma (//prašivý pes, prašivého psa// atd.) | | |
^ Fráze | -- (nenajde nic) | najde sekvenci přesně těchto tvarů | | |
| |
Jelikož //fráze// hledá přesně vložený řetězec znaků (sekvenci slovních tvarů), ''černý kočka'' nenajde -- v korpusu SYN2015 toto sousloví není doloženo ani jako případný překlep. | |
| |
<wrap lo>V syntaxi [[pojmy:dotazovaci_jazyk|CQL]] odpovídá tento typ dotazu následujícímu výrazu: ''[word=<nowiki>"</nowiki>černý<nowiki>"</nowiki>][word=<nowiki>"</nowiki>kočka<nowiki>"</nowiki>]''.</wrap> | |
| |
==== Typ dotazu: Část slova ==== | |
| |
Pokud potřebujeme vyhledat všechna slova, která obsahují nějaký řetězec znaků (např. určitý kořen), může se hodit typ dotazu //část slova//. S jeho pomocí najdeme všechna slova, která obsahují danou sekvenci znaků, jíž předcházejí nebo za níž následují libovolné další znaky (ale také třeba žádný). Při zadání ''pes'' identifikuje tento typ dotazu kromě samotného //pes// i tvary jako //kapesní, pestré, herpes// atd. | |
| |
<wrap lo>V syntaxi [[pojmy:cql|CQL]] tento typ dotazu odpovídá výrazu ''[word=%%".*pes.*"%%]''</wrap> | |
| |
==== Typ dotazu: CQL ==== | |
| |
Poslední a zároveň nejobecnější způsob hledání v korpusu představuje [[pojmy:cql|dotazovací jazyk CQL]]. Všechny výše zmíněné způsoby dotazovaní jsou rozhraním KonText převáděny právě na tento typ dotazu. | Výchozím nastavením je **jednoduchý dotaz**, v němž je dále implicitně nastaveno nerozlišování velikosti písmen (přepínač Shoda velikosti písmen je vypnutý), není povoleno použití regulárních výrazů (přepínač Povolit regulární výrazy je vypnutý) a vyhledávání je nastaveno podle výchozího atributu ''lemma|word'' (v SYN2020 ''lemma|sublemma|word''), čímž se vyhledá nejen uvedený tvar (podle atributu word), ale i další tvary slova (podle atributů lemma nebo sublemma), pokud je zadaný tvar zároveň lemmatem nebo sublemmatem (poznámka: oproti předchozím verzím KonTextu nejde o změnu, jen o zobecnění chování původního základního dotazu). Do vstupního řádku je možné kromě jednotlivých slov zadávat i celé fráze. Vyhledávání lze na jednotlivých pozicích upřesnit jednak pomocí [[manualy:kontext:novy_dotaz#naseptavac|našeptávače]], jednak změnou výchozího atributu (atribut je pak platný pro všechny pozice) a/nebo přepnutím shody velikosti písmen. Složitější dotazy je možné pokládat i v rámci jednoduchého dotazu, pokud uživatel využije volby Povolit regulární výrazy. |
| |
Jako nejobecnější způsob dotazování poskytuje CQL největší možnosti, zároveň ale vyžaduje zvládnutí několika málo formálních náležitostí. Podrobně se proto budeme věnovat CQL v [[pokrocile_dotazy|pokročilejší fázi tohoto kurzu]]. | **Pokročilý dotaz** se aktivuje spínačem nad vstupním řádkem a plně odpovídá dotazu typu CQL předchozích verzí KonTextu. Při zadávání dotazovacího jazyka CQL KonText automaticky kontroluje a zvýrazňuje syntax dotazu. V případě, že dotaz není validní, KonText na to uživatele upozorní a umožní mu dotaz před vyhodnocením opravit. Vzhledem k širokým možnostem CQL dotazování však není kontrola správnosti dotazu vždy přesná, výjimečně se tak může stát, že se varování objeví i v případě validního dotazu. |
===== Shrnutí: Nač je který typ dotazu vhodný ===== | |
| |
^ Typ dotazu ^ Nač je vhodný ^ Jak funguje ^ <html><div class="vertical"><a href="https://wiki.korpus.cz/doku.php/pojmy:regularni_vyrazy">Regulární výrazy</a></div></html> ^ <html><div class="vertical"><a href="https://wiki.korpus.cz/doku.php/pojmy:case-sensitive">Case sensitive</a></div></html> ^ <html><div class="vertical">Víceslovné dotazy</div></html> ^ <html><div class="vertical">Slovní druhy</div></html> ^ Příklady ^ | Je-li zadán dotaz, je možné spustit vyhledávání buď kliknutím na tlačítko Hledat, nebo stisknutím klávesy Enter (kurzor musí být umístěn ve vstupním řádku). |
^ Základní | pro orientační a rychlé hledání | Vyhledá vložený výraz jako slovní tvar bez ohledu na velikost písmen; jde-li zároveň o základní slovníkový tvar (lemma), vyhledají se také všechny jeho tvary. | ✗ | ✗ | ✓ | ✗ | ''černý kočka'' → //černá kočka, černou kočku, černých koček…//\\ ''černá kočka'' → //černá kočka// | | |
^ Lemma | pro analýzu celého paradigmatu/lexému | Vyhledá všechny tvary přiřazené k danému [[pojmy:lemma|lemmatu]]. | ✓ | ✓ | ✗ | ✓ | ''černý'' → //černý, černému, černá, černé, černými…//\\ ''kočka'' → //kočka, kočku, koček, kočkám…// | | |
^ Fráze | pro posloupnost několika slovních tvarů | Vyhledá zadanou frázi složenou z konkrétních slovních tvarů. | ✓ | (✓)((Lze ovlivnit pomocí volby //Shoda velikosti písmen// pod dotazovacím řádkem.)) | ✓ | ✗ | ''černý pes'' → //černý pes//\\ ''český pes'' → //český pes//\\ ''černého psa'' → //černého psa// | | |
^ Slovní tvar | pro analýzu jednoho konkrétního tvaru | Vyhledá zadaný slovní tvar ([[pojmy:word|word]]). | ✓ | (✓)((Lze ovlivnit pomocí volby //Shoda velikosti písmen// pod dotazovacím řádkem.)) | ✗ | ✓ | ''jakkoli'' → //jakkoli//\\ ''jakkoliv'' → //jakkoliv//\\ ''jakkoli.*'' → //jakkoli, jakkoliv, Jakkoli, JAKKOLIV…// | | |
^ Část slova | pro vyhledání řetězce znaků kdekoli ve slově | Vyhledá po sobě následující znaky v rámci jednoho slova. | ✓ | ✓ | ✗ | ✗ | ''pra'' → //praděda, praxe, doprava, lepra…//\\ ''křá'' → //pookřát, křáp, Jiskřákovi…// | | |
^ CQL | pro vyhledání všeho, co lze pomocí korpusového manažeru vyhledat | CQL je [[pojmy:dotazovaci_jazyk|Corpus Query Language]], korpusový dotazovací jazyk (do něhož si rozhraní KonText samo interně převádí všechny předchozí typy dotazů). | ✓ | ✓ | ✓ | ✓ | ''[lemma=<nowiki>"</nowiki>kočka<nowiki>"</nowiki>]'' → //kočka, kočku, koček, kočkám…//\\ ''[word=<nowiki>"</nowiki>černá<nowiki>"</nowiki>]'' → //černá//\\ ''[lemma=<nowiki>"</nowiki>číst<nowiki>"</nowiki>][tag=<nowiki>"</nowiki>N.*<nowiki>"</nowiki>]'' → //číst levity, četli článek, nečtete noviny…// | | |
| |
<html> | |
<script> | |
(function() { | |
[].forEach.call(document.getElementsByClassName("vertical"), function(v) { | |
var w = v.offsetWidth, | |
h = v.offsetHeight; | |
v.style.width = h + "px"; | |
v.style.height = w + "px"; | |
v.style.transform = "translate(" + (w/2 - h/2) + "px, " + (w/2 - h/2) + "px) rotate(270deg)"; | |
//v.style.whiteSpace = "nowrap"; | |
}); | |
})(); | |
</script> | |
<style> | |
.vertical a { | |
text-decoration: none; | |
background: none !important; | |
} | |
</style> | |
</html> | |
===== Jak citovat korpus ===== | ===== Jak citovat korpus ===== |
| |
[{{ :kurz:jak_citovat_korpus.png?300|Zobrazení základních informací o korpusu a jeho bibliografické citace. FIXME}}] | [{{ :kurz:jak_citovat_korpus.png?direct&300|Zobrazení základních informací o korpusu a jeho bibliografické citace. }}] |
| |
Pokud ve svém lingvistickém (či jiném) výzkumu používáte některý z [[cnk:uvod|korpusů ČNK]], je třeba ho citovat v seznamu literatury. Pádných důvodů k tomu je hned několik: | Pokud ve svém lingvistickém (či jiném) výzkumu používáte některý z [[cnk:uvod|korpusů ČNK]], je třeba ho citovat v seznamu literatury. Pádných důvodů k tomu je hned několik: |
| |
- Každý výzkum by měl být replikovatelný, tedy ověřitelný dalšími badateli. V případě [[pojmy:referencni|korpusů referenčních]], jako je např. [[cnk:syn2015|SYN2015]] nebo [[cnk:oral2013|ORAL2013]], lze stejným dotazem vždy dojít ke stejnému výsledku, tedy i ověřit závěry vyvozené z jakéhokoli předchozího výzkumu. U korpusů verzovaných (např. [[cnk:syn|SYN]], [[cnk:intercorp|InterCorp]], [[cnk:diakorp|DIAKORP]]), které s každou novou verzí rostou, je třeba dodat také informaci o verzi. | - Každý výzkum by měl být replikovatelný, tedy ověřitelný dalšími badateli. V případě [[pojmy:referencni|korpusů referenčních]], jako je např. [[cnk:syn2020|SYN2020]] nebo [[cnk:oral2013|ORAL2013]], lze stejným dotazem vždy dojít ke stejnému výsledku, tedy i ověřit závěry vyvozené z jakéhokoli předchozího výzkumu. U korpusů verzovaných (např. [[cnk:syn|SYN]], [[cnk:intercorp|InterCorp]], [[cnk:diakorp|DIAKORP]], [[cnk:online|ONLINE]]), které s každou novou verzí rostou, je třeba dodat také informaci o verzi, příp. o datu zveřejnění. |
- Bez údaje o tom, v kterém z korpusů ČNK byl daný jev vyhledán, nemůže být jeho analýza úplná. U většiny jevů totiž zcela zásadně záleží na velikosti korpusu (viz např. [[pojmy:typ#pomer_poctu_typu_a_tokenu|TTR]]), ale i na tom, o jaký typ dat jde (např. data psaná vs. mluvená). | - Bez údaje o tom, v kterém z korpusů ČNK byl daný jev vyhledán, nemůže být jeho analýza úplná. U většiny jevů totiž zcela zásadně záleží na velikosti korpusu (viz např. [[pojmy:typ#pomer_poctu_typu_a_tokenu|TTR]]), ale i na tom, o jaký typ dat jde (např. data psaná vs. mluvená). |
- Korpusy ČNK jsou zahrnuty v [[https://www.rvvi.cz/riv|RIV]] a na základě toho je třeba je citovat jako jakékoli jiné akademické dílo. | - Korpusy ČNK jsou zahrnuty v [[https://www.rvvi.cz/riv|RIV]] a na základě toho je třeba je citovat jako jakékoli jiné akademické dílo. |
| |
<WRAP round help 70%> | <WRAP round help 70%> |
* Umíte v korpusu [[cnk:syn2015|SYN2015]] najít všechny výskyty slovního tvaru //nejneobvyklejší//? | * Umíte v korpusu [[cnk:syn2020|SYN2020]] najít všechny výskyty slovního tvaru //nejvznešenější//? |
* Pokud byste chtěli zobrazit všechny výskyty tohoto slova spadající pod příslušný základní tvar, použijte lemma //obvyklý//. | * Pokud byste chtěli zobrazit všechny výskyty tohoto slova spadající pod příslušný základní tvar, použijte lemma //vznešený//. |
* Výsledek najdete na speciální stránce s [[kurz:reseni_ukolu|řešeními úkolů]]. | * Výsledek najdete na speciální stránce s [[kurz:reseni_ukolu|řešeními úkolů]]. |
</WRAP> | </WRAP> |