====== Kurz práce s korpusem v 7 lekcích ====== Všechny korpusy, jež zpřístupňuje [[cnk:uvod|Český národní korpus]], je možné (po [[kurz:zaciname|registraci]]) prohlížet pomocí několika [[pojmy:korpusovy_manazer|manažerů či rozhraní]]. Jejich přehled, výhody a nevýhody jsou uvedeny níže. Tento kurz vás seznámí s rozhraním **KonText** (vedle toho je na této wiki k dispozici i [[manualy:kontext:index|manuál rozhraní KonText]], který popisuje jeho jednotlivé funkce). Základní principy se do značné míry shodují se staršími dnes už v rámci ČNK nepodporovanými aplikacemi [[pojmy:korpusovy_manazer#bonito|Bonito]] a [[pojmy:korpusovy_manazer#nosketch_engine|NoSkE]], zejm. způsob vytváření dotazu (dotazovací jazyk [[pojmy:cql|CQL]]); jisté rozdíly tu však jsou nejen co do vzhledu a ovládání, ale i v oblasti nabízených možností. Před započetím práce s korpusy ČNK je nutná **registrace**. S ní vám pomůže sekce [[kurz:zaciname|Jak začít pracovat s Českým národním korpusem]]. Celou řadu užitečných informací najdete také v instruktážních videích [[https://www.youtube.com/channel/UC-uqhilFMCkstQXtabW2Rag|na YouTube kanálu ČNK]]. ===== Obsah ===== ^ Lekce ^ Téma ^ Náplň ^ ^ 1. lekce | [[prvni_dotaz|První dotaz]] | Jak začít. Typy dotazů | ^ 2. lekce | [[zobrazeni_dotazu|Zobrazení výsledků]] | Co lze u dotazu zobrazit. Vnitřní struktura dat, metainformace, ukládání | ^ 3. lekce | [[vyhodnoceni_dotazu|Vyhodnocení dotazu]] | Jak dotaz vyhodnotit. Konkordance, kontext, frekvenční distribuce, třídění | ^ 4. lekce | [[regularni_vyrazy|Regulární výrazy]] | Využívání regulárních výrazů při dotazování | ^ 5. lekce | [[pokrocile_dotazy|Dotazovací jazyk]] | Dotazovací jazyk CQL, kombinace dotazů, pokročilé dotazy | ^ 6. lekce | [[hledani_kolokaci|Hledání kolokací]] | Další práce s dotazem. Kolokace, asociační míry a frekvenční distribuce | ^ 7. lekce | [[subkorpusy|Vytváření vlastních subkorpusů]] | Výběr textů v rámci korpusu, práce s podmínkami | ^ Bonusová lekce | [[Hledání v paralelním korpusu]] | Specifika kladení dotazů a jejich vyhodnocování v paralelním korpusu [[cnk:intercorp|InterCorp]] | ^ Bonusová lekce | [[Hledání v mluvených korpusech]] | Specifika kladení dotazů a jejich vyhodnocování v mluvených korpusech řady [[cnk:oral2013|ORAL]] | ^ Bonusová lekce | [[Hledání v diachronním korpusu]] | Specifika kladení dotazů a jejich vyhodnocování v diachronním korpusu [[cnk:diakorp|Diakorp]] | ^ Bonusová lekce | [[kurz:syntakticka_analyza|Hledání v syntakticky anotovaných korpusech]] | Specifika kladení dotazů a jejich vyhodnocování v syntakticky anotovaných korpusech (momentálně pouze [[cnk:syn2015|SYN2015]], [[cnk:syn2020|SYN2020]] a [[cnk:intercorp:verze13ud|InterCorp v13ud]]) | ^ Řešení | [[reseni_ukolu|Řešení úloh ze všech lekcí]] | Výsledky vyhledávání | Na vytvoření, testování a aktualizaci kurzu se v různých fázích podíleli: Olga Richterová, Václav Cvrček, Michal Škrabal, Dominika Kováříková, Lucie Chlumská, Jan Kocek, Michala Adamová, Martin Vavřín, Marie Kopřivová, David Lukeš, Zuzana Komrsková, Petra Poukarová, Anna Řehořková, Tomáš Jelínek, Michal Křen a další spolupracovníci ÚČNK. ===== Korpusové vyhledávače (manažery, rozhraní) ===== K datům, jež korpusy obsahují, můžeme přistupovat pomocí různých aplikací, tzv. [[pojmy:korpusovy_manazer|manažerů či rozhraní]]. ^ Manažer ^ Charakteristika ^ Je aktualizovaný? ^ ^ [[kontext|KonText]] | nejnovější manažer, vyvíjen od r. 2013 | vyvíjený v ÚČNK ([[seznamy:kontext_verze|přehled verzí]]) | ^ [[pojmy:korpusovy_manazer#sketch_engine|SkE]] | Sketch Engine, nástupce Bonita fungující v rámci internetového prohlížeče | placený manažer obsahující funkci tzv. word-sketches (slovní profily) | ^ [[pojmy:korpusovy_manazer#nosketch_engine|NoSkE]] | NoSketch Engine, redukovaná nezpoplatněná verze Sketch Engine | rozhraní už není v rámci ČNK podporováno | ^ [[pojmy:korpusovy_manazer#park|Park]] | manažer pouze pro přístup k paralelním korpusům | rozhraní už není v rámci ČNK podporováno | ^ [[pojmy:korpusovy_manazer#bonito|Bonito]] | v současnosti už nepodporovaný manažer, instaloval se na lokální PC | rozhraní už není v rámci ČNK podporováno | ==== Další korpusové nástroje ==== Těmto nástrojům se v kurzu nebudeme přímo věnovat, jde však o další užitečné způsoby, jak vytěžovat data, jež Český národní korpus zpřístupňuje. Doporučujeme vaší pozornosti: * [[http://syd.korpus.cz|SyD]] ([[manualy:syd|manuálová stránka]]) * [[http://morfio.korpus.cz|Morfio]] ([[manualy:morfio|manuálová stránka]]) * [[http://kwords.korpus.cz|KWords]] ([[manualy:kwords|manuálová stránka]]) * [[http://treq.korpus.cz|Treq]] ([[manualy:treq|manuálová stránka]]) * [[manualy:proskoly|Pro školy]] - stránka s korpusovými cvičeními pro výuku jazyka na ZŠ a SŠ ([[http://korpus.cz/proskoly|přejít na aplikaci]]) ---- [[manualy:kontext:index|Manuál rozhraní KonText]] • [[manualy:kontext:novy_dotaz|Menu: Nový dotaz]] • [[zaciname|Jak začít pracovat s ČNK]] • [[cnk:citace|Jak citovat]]