Nastavení

Toto je starší verze dokumentu!


Práce s korpusovým rozhraním

Všechny korpusy, jež zpřístupňuje Český národní korpus, je možné (po registraci) prohlížet pomocí několika manažerů či rozhraní. Jejich přehled, výhody a nevýhody jsou uvedeny níže.

Tento kurz představí různé funkce nabízené rozhraním KonText. Základní principy se do značné míry shodují se staršími dnes už v rámci ČNK nepodporovanými aplikacemi Bonito a NoSkE, zejm. způsob vytváření dotazu (dotazovací jazyk CQL); jisté rozdíly tu však jsou nejen co do vzhledu a ovládání, ale i v oblasti nabízených možností.

Před započetím práce s korpusy ČNK je nutná registrace. S ní vám pomůže sekce Jak začít pracovat s Českým národním korpusem.

Kurz práce s korpusem v 7 lekcích

Lekce Název Náplň
1. lekce První dotaz Jak začít. Typy dotazů
2. lekce Zobrazení výsledků Co lze u dotazu zobrazit. Vnitřní struktura dat, metainformace, ukládání
3. lekce Vyhodnocení dotazu Jak dotaz vyhodnotit. Konkordance, kontext, frekvenční distribuce, třídění
4. lekce Regulární výrazy Využívání regulárních výrazů při dotazování
5. lekce Dotazovací jazyk Dotazovací jazyk CQL, kombinace dotazů, pokročilé dotazy
6. lekce Hledání kolokací Další práce s dotazem. Kolokace, asociační míry a frekvenční distribuce
7. lekce Vytváření vlastních subkorpusů Výběr textů v rámci korpusu - subkorpusy. Práce s podmínkami within apod.
Bonusová lekce Hledání v paralelním korpusu Specifika kladení dotazů a jejich vyhodnocování v paralelním korpusu InterCorp
Bonusová lekce Hledání v mluvených korpusech Specifika kladení dotazů a jejich vyhodnocování v mluvených korpusech řady ORAL
Bonusová lekce Hledání v diachronním korpusu Specifika kladení dotazů a jejich vyhodnocování v diachronním korpusu Diakorp
Řešení Řešení úloh ze všech lekcí Výsledky vyhledávání

FIXME Na vytvoření, testování a aktualizaci kurzu se v různých fázích podíleli: Olga Richterová, Václav Cvrček, Michal Škrabal, Dominika Kováříková, Jan Kocek

Korpusové vyhledávače (manažery, rozhraní)

K datům, jež korpusy obsahují, se můžeme dostat pomocí různých aplikací, tzv. manažerů či rozhraní.

Manažer Charakteristika Je aktualizovaný?
KonText nejnovější manažer z konce r. 2013 vyvíjený v ÚČNK (přehled verzí)
SKE Sketch Engine, nástupce Bonita fungující v rámci internetového prohlížeče placený manažer obsahující funkci tzv. word-sketches (slovní profily)
NoSKE NoSketch Engine, redukovaná nezpoplatněná verze Sketch Engine rozhraní už není v rámci ČNK podporováno
Park manažer pouze pro přístup k paralelním korpusům rozhraní už není v rámci ČNK podporováno
Bonito v současnosti už nepodporovaný manažer, instaloval se na lokální PC rozhraní už není v rámci ČNK podporováno

Další korpusové nástroje

Těmto nástrojům se v kurzu nebudeme přímo věnovat, jde však o další užitečné způsoby, jak vytěžovat data, jež Český národní korpus zpřístupňuje. Doporučujeme vaší pozornosti: