Toto je starší verze dokumentu!
Obsah
Práce s korpusovým rozhraním
Všechny korpusy, jež zpřístupňuje Český národní korpus, je možné (po registraci) prohlížet pomocí několika manažerů či rozhraní. Jejich přehled, výhody a nevýhody jsou uvedeny níže.
Tento kurz představí různé funkce nabízené rozhraním KonText. Ty základní se do značné míry shodují se starým manažerem Bonito, jisté rozdíly tu však jsou nejen co do vzhledu a ovládání, ale i v oblasti nabízených možností.
Chcete-li se registrovat a začít korpus vytěžovat, můžete postupovat podle sekce Jak začít pracovat s Českým národním korpusem.
Kurz práce s korpusem v 7 lekcích
Lekce | Název | Náplň |
---|---|---|
1. lekce | První dotaz | Jak začít. Typy dotazů. |
2. lekce | Zobrazení dotazu | Co lze u dotazu zobrazit. Vnitřní struktura dat, metainformace, třídění. |
3. lekce | Vyhodnocení dotazu | Jak dotaz vyhodnotit. Konkordance, kontext, frekvenční distribuce. |
4. lekce | Ukládání výsledků | Jak dál pracovat s výsledky. Export dat v různých formátech. Opakování. |
5. lekce | Pokročilé dotazy | Co vše lze zjistit. Dotazovací jazyk, kombinace dotazů. |
6. lekce | Vytváření vlastních subkorpusů | Výběr textů v rámci korpusu - subkorpusy. Práce s podmínkami within apod. |
7. lekce | Hledání kolokací | Další práce s dotazem. Kolokace, asociační míry a frekvenční distribuce. |
bonusová lekce | Hledání v paralelním korpusu | Specifika kladení dotazů a jejich vyhodnocování v paralelním korpusu InterCorp |
Řešení | Řešení úloh ze všech lekcí | Výsledky vyhledávání |
Korpusové vyhledávače (manažery, rozhraní)
K datům, jež korpusy obsahují, se můžeme dostat pomocí různých aplikací, tzv. manažerů či rozhraní.
Manažer | Charakteristika | Je aktualizovaný? |
---|---|---|
Bonito | v současnosti už nepodporovaný manažer, instaloval se na lokální PC | již se nevyvíjí (manuálové stránky) |
SKE | Sketch Engine, nástupce Bonita fungující v rámci internetového prohlížeče | placený manažer obsahující funkci tzv. word-sketches (slovní profily) |
NoSKE | NoSketch Engine, nezpoplatněná verze Sketch Engine | obsahuje stejné funkce jako SKE (s výjimkou word-sketches), základ pro vývoj rozhraní KonText |
Park | manažer pouze pro přístup k paralelním korpusům | vyvíjený v ÚČNK do konce r. 2013, odkdy je možné přístupovat k paralelním korpusům i pomocí rozhraní KonText |
Rozhraní KonText | nejnovější manažer z konce r. 2013 | vyvíjený v ÚČNK, na základě NoSKE |
Další korpusové nástroje
Těmto nástrojům se v kurzu nebudeme přímo věnovat, jde však o další užitečné způsoby, jak vytěžovat data, jež Český národní korpus zpřístupňuje. Doporučujeme Vaší pozornosti: