Skrýt
Nastavení

Toto je starší verze dokumentu!


Vítejte v internetové příručce ČNK!

Wiki pro práci s ČNK a uvedení do korpusové lingvistiky

Nejsme jen země věhlasného Pražského lingvistického kroužku, ale i proslulých moderních korpusů. Projekt Českého národního korpusu zajišťuje přístup k přibližně miliardě a půl slov uspořádaných v korpusech synchronních i diachronních, mluvených i psaných, paralelních i jednojazyčných. Nejde ovšem jen o rozsah, ale především o kvalitu zpracování a uživatelské pohodlí při jejich vytěžování. K tomu, aby se vám s ČNK co nejlépe pracovalo, má sloužit tento přehledný manuál.

Co je korpus?

Velmi stručně řečeno, jazykový korpus je rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednotném formátu tak, aby v něm bylo možné jednoduše vyhledávat jazykové jevy, zejména slova a slovní spojení (kolokace). Od obyčejného textového archívu či databáze jej odlišuje především skutečnost, že bývá pečlivě sestaven za konkrétním, nejčastěji lingvistickým účelem (např. má reprezentovat současný mluvený či psaný jazyk nebo jeho část, např. publicistické texty). Korpus zobrazuje jazykové jevy v jejich přirozeném kontextu, a umožňuje tak vytvářet na reálných datech podložený jazykový výzkum v rozsahu, který byl dříve nemyslitelný.

S čím má tato Wiki pomoci

Možnosti využití těchto stránek

Co hledám Kde to najdu
Nemůžu v rozhraní KonText najít určitou funkci Manuál práce s korpusovým rozhraním
Jaké korpusy mám vlastně k dispozici? Z jakých korpusů se skládá Český národní korpus?
Chci se naučit klást složitější dotazy Pokročilé dotazy
Není mi jasný význam určitého pojmu Přehled základních pojmů korpusové lingvistiky
Hledám příklady korpusového výzkumu Vybrané lingvistické problémy řešené s pomocí korpusů
Jaké funkce nabízí rozhraní KonText? Menu vedoucí k informacím o všech funkcích rozhraní KonText

Malý příklad práce s korpusem na závěr

Změna v užívání odvozenin od věhlasný a proslulý v 19. století v aplikaci SyD

Kde zjistím, jak se to má se zdánlivými synonymy věhlasný a proslulý? To, jaké výrazy se s těmito slovy pojí, si můžete prohlédnout v aplikaci SyD, pod záložkou kolokace. Jak je vidět, věhlasný může být třeba chirurg, odborník či vědec, ale proslulý se pojí spíš s příslovci blaze, nechvalně či světově. Tento typ rozdílu v užití (věhlasný + N, Adv + proslulý) je těžko zjistitelný jinak než analýzou velkého množství reálných dat.

A jak se tyto výrazy užívaly v minulosti?

Potřebujete se poradit?

Nebojte se nás Kontaktovat! Naše pracoviště neposkytuje pouze data a přístup k nim, ale i poradenství. Od roku 2014 nabízíme všem registrovaným uživatelům službu Poradna, kde je možné pokládat libovolné dotazy, hlásit chyby v našich aplikacích a posílat návrhy na jejich vylepšení. Dále zůstáva možnost standardních e-mailových, telefonických a osobních konzultací. V případě zájmu můžeme pro větší počet osob uspořádat seminář: buď v Praze, nebo na Vašem pracovišti.