Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize | ||
pojmy:korpus [2017/06/08 15:42] – [Typy korpusů] michalkren | pojmy:korpus [2021/10/23 05:00] – [Korpus a jeho využití] michalskrabal | ||
---|---|---|---|
Řádek 13: | Řádek 13: | ||
Rozsah ovšem není jediným kritériem kvality a spolehlivosti korpusu. Jakkoli rozsáhlý korpus je vždy jen vzorkem jazyka a z toho titulu je třeba na něj klást stejné nároky jako na každý jiný vzorek. Abychom mohli výsledky získané na vzorku (korpusu) vztáhnout na celou populaci (všechny texty, celý jazyk), je třeba zajistit, aby korpus byl vzhledem k populaci, kterou má zrcadlit, [[pojmy: | Rozsah ovšem není jediným kritériem kvality a spolehlivosti korpusu. Jakkoli rozsáhlý korpus je vždy jen vzorkem jazyka a z toho titulu je třeba na něj klást stejné nároky jako na každý jiný vzorek. Abychom mohli výsledky získané na vzorku (korpusu) vztáhnout na celou populaci (všechny texty, celý jazyk), je třeba zajistit, aby korpus byl vzhledem k populaci, kterou má zrcadlit, [[pojmy: | ||
- | Pro usnadnění práce s korpusy jsou texty v nich obsažené často [[pojmy: | + | Pro usnadnění práce s korpusy jsou texty v nich obsažené často [[pojmy: |
==== Využití v lingvistice ==== | ==== Využití v lingvistice ==== | ||
Řádek 26: | Řádek 26: | ||
Vznik korpusu by vždy měl být podřízen jeho účelu, od toho se odvíjí i jejich klasifikace. Korpusy třídit podle různých kritérií: | Vznik korpusu by vždy měl být podřízen jeho účelu, od toho se odvíjí i jejich klasifikace. Korpusy třídit podle různých kritérií: | ||
- | - z hlediska počtu jazyků: | + | - z hlediska počtu jazyků: |
- | - z hlediska tématu ap.: a) obecný | + | - jednojazyčný |
- | - z hlediska modu: a) psaný | + | - vícejazyčný |
- | - z hlediska časového záběru: | + | - z hlediska tématu ap.: |
- | - z hlediska „archeologického“: | + | - obecný |
+ | - specializovaný, | ||
+ | - z hlediska modu: | ||
+ | - psaný | ||
+ | - mluvený, | ||
+ | - z hlediska časového záběru: | ||
+ | - synchronní | ||
+ | - diachronní, | ||
- z hlediska vymezeného účelu různé | - z hlediska vymezeného účelu různé | ||
Řádek 49: | Řádek 56: | ||
Projekt [[http:// | Projekt [[http:// | ||
- | Od svého počátku si kladl za cíl být centrem korpusového výzkumu v ČR a poskytovatelem korpusů pro všechny druhy výzkumu (nejen lingvistického). V roce 2012 zahrnoval | + | Od svého počátku si kladl za cíl být centrem korpusového výzkumu v ČR a poskytovatelem korpusů pro všechny druhy výzkumu (nejen lingvistického). V roce 2021 zahrnuje |
* synchronní korpusy psané, řada SYN | * synchronní korpusy psané, řada SYN | ||
* synchronní korpusy mluvené, zejm. řadu ORAL | * synchronní korpusy mluvené, zejm. řadu ORAL | ||
+ | * webové korpusy ONLINE a NET | ||
* diachronní korpus DIAKORP | * diachronní korpus DIAKORP | ||
* paralelní korpus InterCorp | * paralelní korpus InterCorp | ||
+ | * specializované korpusy akviziční, | ||
Přístup ke všem korpusům prostřednictvím webového rozhraní je bezplatný, z licenčních důvodů je nutná registrace. ČNK zároveň poskytuje možnost hostování i mnoha dalším korpusům. | Přístup ke všem korpusům prostřednictvím webového rozhraní je bezplatný, z licenčních důvodů je nutná registrace. ČNK zároveň poskytuje možnost hostování i mnoha dalším korpusům. |