Nastavení

This is an old revision of the document!



Welcome to the Czech National Corpus wiki


The Czech National Corpus (ČNK) project was set up in 1994 in order to make accessible extensive linguistic data for teaching and research in the form of electronic corpora. The Czech National Corpus currently ensures access to more than three billion words contained in both synchronic and diachronic corpora, both spoken and written, paralell and monolinguistic. For working with them the ČNK develops specialized tools.

The ČNK project is managed mainly by the workers of two departments under FF UK (Faculty of Arts, Charles University): The Institute of the Czech National Corpus and The Institute of Theoretical and Computational Linguistics. The collection of data and coordination of the individual activities is done with the aid of more than two hundred external workers from all over the Czech Republic.

What information will you find here?

This wiki serves ČNK users not only as a source of information about the ČNK (description of public corpora and their documentation, application manuals), but also as a continuously edited database of corpus linguistic knowledge. The main parts of the wiki consist of the following:

Manuals for ČNK applications
Overview of corpora available within the ČNK
Tutorial for working with the EEBO in 8 lessons
Index of basic concepts in corpus linguistics
List of sources and abbreviations

Frequently searched pages

Manuals for ČNK applications

What is a corpus?

A languagecorpus is an extensive collection of authentic textual data (written or spoken) converted to electronic form in a uniform format, meaning that it can easily be searched for various linguistic phenomena – especially words and phrases (collocations). Od obyčejného textového archívu či databáze jej odlišuje především to, že bývá pečlivě sestaven s ohledem na výzkumný účel (má například reprezentovat současný mluvený či psaný jazyk nebo jeho část, např. publicistické texty). Korpus zobrazuje jazykové jevy v jejich přirozeném kontextu, a umožňuje tak vytvářet na reálných datech podložený jazykový výzkum v rozsahu, který byl dříve nemyslitelný.

User support

Všem uživatelům je k dispozici Poradna, do které je možné klást libovolné dotazy týkající se práce s ČNK (vytváření dotazů, specifika korpusů apod.). Většina dotazů je zodpovězena do jednoho pracovního dne.

Centrum uživatelské podpory zahrnuje také hlášení chyb v aplikacích ČNK a zasílání návrhů na jejich vylepšení. Odkaz na formulář takového hlášení najdete v každé aplikaci zcela vespod – “Nahlásit chybu”.