Přihlášení | Registrace English

Vítejte na wiki Českého národního korpusu


Projekt Český národní korpus byl založen v roce 1994, aby vytvářel a zpřístupňoval rozsáhlá jazyková data pro výuku a výzkum ve formě elektronických korpusů. V současné době zajišťuje přístup k více než třem miliardám slov uspořádaných v korpusech synchronních i diachronních, mluvených i psaných, paralelních i jednojazyčných. Pro práci s nimi vyvíjí i specializované nástroje.

Projekt ČNK provozují zejména pracovníci dvou ústavů FF UK: Ústavu Českého národního korpusu a Ústavu teoretické a komputační lingvistiky. Na sběru materiálů a koordinaci dílčích činností se ovšem kromě toho podílejí i více než dvě stovky externistů z celé ČR.

Jaké informace zde najdete?

Tato wiki slouží uživatelům ČNK nejen jako zdroj informací o ČNK (popis zveřejněných korpusů a dokumentace k nim, manuály k aplikacím), ale také jako průběžně doplňovaná báze znalostí o korpusové lingvistice. Hlavní části wiki tvoří tyto oddíly:

Manuály k aplikacím ČNK
Přehled korpusů dostupných v rámci ČNK
Kurz práce s korpusem v 7 lekcích
Slovníček základních pojmů z korpusové lingvistiky
Seznamy zdrojů a zkratek

Často vyhledávané stránky

Manuálové stránky aplikací ČNK

Užitečné odkazy

Co je korpus?

Jazykový korpus je rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednotném formátu tak, aby bylo možné v něm jednoduše vyhledávat různé jazykové jevy – zejména slova a slovní spojení (kolokace). Od obyčejného textového archívu či databáze jej odlišuje především to, že bývá pečlivě sestaven s ohledem na výzkumný účel (má například reprezentovat současný mluvený či psaný jazyk nebo jeho část, např. publicistické texty). Korpus zobrazuje jazykové jevy v jejich přirozeném kontextu, a umožňuje tak vytvářet na reálných datech podložený jazykový výzkum v rozsahu, který byl dříve nemyslitelný.

Uživatelská podpora

Všem uživatelům je k dispozici Poradna, do které je možné klást libovolné dotazy týkající se práce s ČNK (vytváření dotazů, specifika korpusů apod.). Většina dotazů je zodpovězena do jednoho pracovního dne.

Centrum uživatelské podpory zahrnuje také hlášení chyb v aplikacích ČNK a zasílání návrhů na jejich vylepšení. Odkaz na formulář takového hlášení najdete v každé aplikaci zcela vespod – „Nahlásit chybu“.