Toto je starší verze dokumentu!
Obsah
Práce s korpusovým rozhraním
Všechny korpusy, jež zpřístupňuje Český národní korpus, je možné (po registraci) prohlížet pomocí několika manažerů či rozhraní. Jejich přehled, výhody a nevýhody jsou uvedeny níže.
Tento kurz představí různé funkce nabízené rozhraním KonText. Ty základní se do značné míry shodují se starým manažerem Bonito a rozhraním NoSkE, jisté rozdíly tu však jsou nejen co do vzhledu a ovládání, ale i v oblasti nabízených možností.
Před započetím práce s korpusy ČNK je nutná registrace. S ní vám pomůže sekce Jak začít pracovat s Českým národním korpusem.
Kurz práce s korpusem v 7 lekcích
Lekce | Název | Náplň |
---|---|---|
1. lekce | První dotaz | Jak začít. Typy dotazů. |
2. lekce | Zobrazení dotazu | Co lze u dotazu zobrazit. Vnitřní struktura dat, metainformace, třídění. |
3. lekce | Vyhodnocení dotazu | Jak dotaz vyhodnotit. Konkordance, kontext, frekvenční distribuce. |
4. lekce | Ukládání výsledků | Jak dál pracovat s výsledky. Export dat v různých formátech. Opakování. |
5. lekce | Pokročilé dotazy | Co vše lze zjistit. Dotazovací jazyk, kombinace dotazů. |
6. lekce | Hledání kolokací | Další práce s dotazem. Kolokace, asociační míry a frekvenční distribuce. |
7. lekce | Vytváření vlastních subkorpusů | Výběr textů v rámci korpusu - subkorpusy. Práce s podmínkami within apod. |
bonusová lekce | Hledání v paralelním korpusu | Specifika kladení dotazů a jejich vyhodnocování v paralelním korpusu InterCorp |
Řešení | Řešení úloh ze všech lekcí | Výsledky vyhledávání |
Korpusové vyhledávače (manažery, rozhraní)
K datům, jež korpusy obsahují, se můžeme dostat pomocí různých aplikací, tzv. manažerů či rozhraní.
Manažer | Charakteristika | Je aktualizovaný? |
---|---|---|
Bonito | v současnosti už nepodporovaný manažer, instaloval se na lokální PC | již se nevyvíjí (manuálové stránky) |
SKE | Sketch Engine, nástupce Bonita fungující v rámci internetového prohlížeče | placený manažer obsahující funkci tzv. word-sketches (slovní profily) |
NoSKE | NoSketch Engine, nezpoplatněná verze Sketch Engine | obsahuje stejné funkce jako SKE (s výjimkou word-sketches), základ pro vývoj rozhraní KonText |
Park | manažer pouze pro přístup k paralelním korpusům | vyvíjený v ÚČNK do konce r. 2013, odkdy je možné přístupovat k paralelním korpusům i pomocí rozhraní KonText |
Rozhraní KonText | nejnovější manažer z konce r. 2013 | vyvíjený v ÚČNK, na základě NoSKE |
Další korpusové nástroje
Těmto nástrojům se v kurzu nebudeme přímo věnovat, jde však o další užitečné způsoby, jak vytěžovat data, jež Český národní korpus zpřístupňuje. Doporučujeme Vaší pozornosti: