Toto je starší verze dokumentu!
ÚVODNÍ STRÁNKA
Wiki pro práci s ČNK a uvedení do korpusové lingvistiky
Nejsme jen země věhlasného Pražského lingvistického kroužku, ale i proslulých moderních korpusů. Projekt Českého národního korpusu zajišťuje přístup k přibližně miliardě a půl slov uspořádaných v korpusech synchronních i diachronních, mluvených i psaných, paralelních i jednojazyčných. Nejde ovšem jen o rozsah, ale především o kvalitu zpracování a uživatelské pohodlí při jejich vytěžování. K tomu, aby se vám s ČNK co nejlépe pracovalo, má sloužit tento přehledný manuál - prozatím v češtině a brzy doufejme i v angličtině.
Co je korpus?
Velmi stručně řečeno, jazykový korpus je rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednotném formátu tak, aby v něm bylo možné jednoduše vyhledávat jazykové jevy, zejména slova a slovní spojení (kolokace). Od obyčejného textového archívu či databáze jej odlišuje především skutečnost, že bývá pečlivě sestaven za konkrétním, nejčastěji lingvistickým účelem (např. má reprezentovat současný mluvený či psaný jazyk nebo jeho část, např. publicistické texty). Korpus zobrazuje jazykové jevy v jejich přirozeném kontextu, a umožňuje tak vytvářet na reálných datech podložený jazykový výzkum v rozsahu, který byl dříve nemyslitelný.
S čím má tato Wiki pomoci
- Představí funkce nabízené novým rozhraním KonText, přes nějž jsou zpřístupňovány korpusy ČNK (včetně návodu, jak s nimi začít pracovat). Průvodce Základy práce s korpusem v 7 lekcích provede všemi základními možnostmi nabízenými v současné době uživatelům.
- Poskytne základní přehled pojmů z korpusové lingvistiky.
- Seznámí s korpusy přístupnými prostřednictvím ČNK, poskytne o nich bližší informace (včetně toho, jak je citovat) a nabídne možnosti využití.
Možnosti využití těchto stránek
Co hledám | Kde to najdu |
---|---|
Nemůžu v rozhraní KonText najít určitou funkci | Manuál práce s korpusovým rozhraním |
Jaké korpusy mám vlastně k dispozici? | Z jakých korpusů se skládá Český národní korpus? |
Chci se naučit klást složitější dotazy | Pokročilé dotazy |
Není mi jasný význam určitého pojmu | Přehled základních pojmů korpusové lingvistiky |
Hledám příklady korpusového výzkumu | Vybrané lingvistické problémy řešené s pomocí korpusů |
Jaké funkce nabízí rozhraní KonText? | Menu vedoucí k informacím o všech funkcích rozhraní KonText |
Malý příklad práce s korpusem na závěr
Kde zjistím, jak se to má se zdánlivými synonymy věhlasný a proslulý? To, jaké výrazy se s těmito slovy pojí, si můžete prohlédnout v aplikaci SyD, pod záložkou kolokace. Jak je vidět, věhlasný může být třeba chirurg, odborník či vědec, ale proslulý se pojí spíš s příslovci blaze, nechvalně či světově. Tento typ rozdílu v užití (věhlasný + N, Adv + proslulý) je těžko zjistitelný jinak než analýzou velkého množství reálných dat.
A jak se tyto výrazy užívaly v minulosti?
Potřebujete se poradit?
Nebojte se nás kontaktovat! Naše pracoviště neposkytuje pouze data a přístup k nim, ale i poradenství. Kromě standardních e-mailových, telefonických a osobních konzultací někteří kolegové konzultují i pomocí služby Skype a v případě zájmu můžeme pro větší počet osob uspořádat seminář: buď v Praze, nebo na Vašem pracovišti.