Vítejte na wiki Českého národního korpusu
Projekt Český národní korpus byl založen v roce 1994, aby vytvářel a zpřístupňoval rozsáhlá jazyková data pro výuku a výzkum ve formě elektronických korpusů. V současné době zajišťuje přístup k více než třem miliardám slov uspořádaných v korpusech synchronních i diachronních, mluvených i psaných, paralelních i jednojazyčných.
Projekt ČNK provozují zejména pracovníci dvou ústavů FF UK: Ústavu Českého národního korpusu a Ústavu teoretické a komputační lingvistiky. Na sběru materiálů a koordinaci dílčích činností se ovšem kromě toho podílejí i více než dvě stovky externistů z celé ČR.
Jaké informace zde najdete?
Tato wiki slouží uživatelům ČNK nejen jako zdroj informací o ČNK (popis zveřejněných korpusů a dokumentace k nim, manuály k aplikacím), ale také jako průběžně doplňovaná báze znalostí o korpusové lingvistice. Hlavní části wiki tvoří tyto oddíly:
Často vyhledávané stránky
Manuálové stránky aplikací ČNK
Užitečné odkazy
Co je korpus?
Jazykový korpus je rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednotném formátu tak, aby bylo možné v něm jednoduše vyhledávat různé jazykové jevy – zejména slova a slovní spojení (kolokace). Od obyčejného textového archívu či databáze jej odlišuje především to, že bývá pečlivě sestaven s ohledem na výzkumný účel (má například reprezentovat současný mluvený či psaný jazyk nebo jeho část, např. publicistické texty). Korpus zobrazuje jazykové jevy v jejich přirozeném kontextu, a umožňuje tak vytvářet na reálných datech podložený jazykový výzkum v rozsahu, který byl dříve nemyslitelný.
Uživatelská podpora
Všem uživatelům je k dispozici Poradna, do které je možné klást libovolné dotazy týkající se práce s ČNK (vytváření dotazů, specifika korpusů apod.). Většina dotazů je zodpovězena do jednoho pracovního dne.
Centrum uživatelské podpory zahrnuje také hlášení chyb v aplikacích ČNK a zasílání návrhů na jejich vylepšení. Odkaz na formulář takového hlášení najdete v každé aplikaci zcela vespod – “Nahlásit chybu”.