Skrýt
Nastavení

Toto je starší verze dokumentu!


Práce s korpusovým rozhraním

Všechny korpusy, jež zpřístupňuje Český národní korpus, je možné (po registraci) prohlížet pomocí několika manažerů či rozhraní. Jejich přehled, výhody a nevýhody jsou uvedeny níže.

Tento kurz představí různé funkce nabízené rozhraním KonText. Základní principy se do značné míry shodují se staršími dnes už v rámci ČNK nepodporovanými aplikacemi Bonito a NoSkE, zejm. způsob vytváření dotazu (dotazovací jazyk CQL); jisté rozdíly tu však jsou nejen co do vzhledu a ovládání, ale i v oblasti nabízených možností.

Před započetím práce s korpusy ČNK je nutná registrace. S ní vám pomůže sekce Jak začít pracovat s Českým národním korpusem.

Kurz práce s korpusem v 7 lekcích

Lekce Název Náplň
1. lekce První dotaz Jak začít. Typy dotazů
2. lekce Zobrazení dotazu Co lze u dotazu zobrazit. Vnitřní struktura dat, metainformace, třídění
3. lekce Vyhodnocení dotazu Jak dotaz vyhodnotit. Konkordance, kontext, frekvenční distribuce
4. lekce Ukládání výsledků Jak dál pracovat s výsledky. Export dat v různých formátech. Opakování
5. lekce Pokročilé dotazy Co vše lze zjistit. Dotazovací jazyk, kombinace dotazů
6. lekce Hledání kolokací Další práce s dotazem. Kolokace, asociační míry a frekvenční distribuce
7. lekce Vytváření vlastních subkorpusů Výběr textů v rámci korpusu - subkorpusy. Práce s podmínkami within apod.
Bonusová lekce Hledání v paralelním korpusu Specifika kladení dotazů a jejich vyhodnocování v paralelním korpusu InterCorp
Bonusová lekce Hledání v mluvených korpusech Specifika kladení dotazů a jejich vyhodnocování v mluvených korpusech řady ORAL
Bonusová lekce Hledání v diachronním korpusu Specifika kladení dotazů a jejich vyhodnocování v diachronním korpusu Diakorp
Řešení Řešení úloh ze všech lekcí Výsledky vyhledávání

FIXME Na vytvoření, testování a aktualizaci kurzu se v různých fázích podíleli: Olga Richterová, Václav Cvrček, Michal Škrabal, Dominika Kováříková, Jan Kocek

Korpusové vyhledávače (manažery, rozhraní)

K datům, jež korpusy obsahují, se můžeme dostat pomocí různých aplikací, tzv. manažerů či rozhraní.

Manažer Charakteristika Je aktualizovaný?
KonText nejnovější manažer z konce r. 2013 vyvíjený v ÚČNK (přehled verzí)
SKE Sketch Engine, nástupce Bonita fungující v rámci internetového prohlížeče placený manažer obsahující funkci tzv. word-sketches (slovní profily)
NoSKE NoSketch Engine, redukovaná nezpoplatněná verze Sketch Engine rozhraní už není v rámci ČNK podporováno
Park manažer pouze pro přístup k paralelním korpusům rozhraní už není v rámci ČNK podporováno
Bonito v současnosti už nepodporovaný manažer, instaloval se na lokální PC rozhraní už není v rámci ČNK podporováno

Další korpusové nástroje

Těmto nástrojům se v kurzu nebudeme přímo věnovat, jde však o další užitečné způsoby, jak vytěžovat data, jež Český národní korpus zpřístupňuje. Doporučujeme vaší pozornosti: