Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verze | |
manualy:korpusdb [2021/02/15 10:58] – jankocek | manualy:korpusdb [2021/02/15 11:15] (aktuální) – jankocek |
---|
====== KorpusDB: databáze slovních tvarů a lemmat doložených v korpusech ČNK ====== | ====== KorpusDB: databáze slovních tvarů a lemmat doložených v korpusech ČNK ====== |
| |
{{ :manualy:korpusdb_logo.png?direct&200|}} | {{ :manualy:korpusdb_logo.png?nolink&200|}} |
| |
Databáze obsahuje všechny rozpoznané slovní tvary lemmat, která se reálně vyskytují v některém ze zpracovaných korpusů ČNK: [[cnk:syn:verze8|SYN v8]] (současná psaná čeština), [[cnk:oral|ORAL v1]] a [[cnk:ortofon|ORTOFON v1]] (současná mluvená čeština), [[cnk:diakorp|DIAKORP v6]] a nezveřejněný korpus textů 19. stol. Protože se lemmatizace a morfologické značkování těchto korpusů mírně liší, byly jako zdroj dat použity jejich interní verze s jednotným zpracováním. | Databáze obsahuje všechny rozpoznané slovní tvary lemmat, která se reálně vyskytují v některém ze zpracovaných korpusů ČNK: [[cnk:syn:verze8|SYN v8]] (současná psaná čeština), [[cnk:oral|ORAL v1]] a [[cnk:ortofon|ORTOFON v1]] (současná mluvená čeština), [[cnk:diakorp|DIAKORP v6]] a nezveřejněný korpus textů 19. stol. Protože se lemmatizace a morfologické značkování těchto korpusů mírně liší, byly jako zdroj dat použity jejich interní verze s jednotným zpracováním. |