AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
manualy:korpusdb [2020/07/27 17:12] – vytvořeno Michal Křenmanualy:korpusdb [2021/02/15 11:15] (aktuální) Jan Kocek
Řádek 1: Řádek 1:
-Databáze obsahuje všechny rozpoznané slovní tvary lemmat, která se reálně vyskytují v některém ze zpracovaných korpusů ČNK: SYN v8 (současná psaná čeština), ORAL v1 a ORTOFON v1 (současná mluvená čeština), Diakorp v6 a nezveřejněný korpus textů 19. stol. Protože se lemmatizace a morfologické značkování těchto korpusů mírně liší, byly jako zdroj dat použity jejich interní verze s jednotným zpracováním.+====== KorpusDB: databáze slovních tvarů a lemmat doložených v korpusech ČNK ====== 
 + 
 +{{ :manualy:korpusdb_logo.png?nolink&200|}} 
 + 
 +Databáze obsahuje všechny rozpoznané slovní tvary lemmat, která se reálně vyskytují v některém ze zpracovaných korpusů ČNK: [[cnk:syn:verze8|SYN v8]] (současná psaná čeština), [[cnk:oral|ORAL v1]] [[cnk:ortofon|ORTOFON v1]] (současná mluvená čeština), [[cnk:diakorp|DIAKORP v6]] a nezveřejněný korpus textů 19. stol. Protože se lemmatizace a morfologické značkování těchto korpusů mírně liší, byly jako zdroj dat použity jejich interní verze s jednotným zpracováním
 + 
 +Webové rozhraní nad databází je dostupné bez registrace na adrese: **[[https://db.korpus.cz/]]** 
 + 
 +Webové rozhraní uka­zuje mj. celá pa­ra­dig­mata spolu s frek­ven­cemi tvarů v růz­ných ty­pech textu a s mož­ností fil­tro­vání ka­te­go­rií podle míry va­ri­a­bi­lity tvarů v nich. Zkuste si například na https://db.korpus.cz/search/lemmas najít lemma //motýl//, zapnout přepínač "seskupit varianty" a změnit "úroveň filtru" na 4. Objeví se celkem 5 morfologických kategorií, v nichž je doložena největší variabilita, jejímž zdrojem jsou v některých kategoriích současné psané texty (dat.sg., loc.sg.), v některých čeština 19. století (nom.pl., acc.pl.) a jindy primárně čeština mluvená (inst.pl.): 
 + 
 +[{{:manualy:korpusdb_motyl.png?direct&400|Lemma //motýl// v rozhraní KorpusDB}}] 
 + 
 +Podrobnější návod pro práci s KorpusDB najdete přímo v aplikaci po kliknutí na ikonu s otazníkem.
  
 ===== Jak citovat aplikaci KorpusDB ===== ===== Jak citovat aplikaci KorpusDB =====
Řádek 5: Řádek 17:
 <WRAP round tip 80%> <WRAP round tip 80%>
  
-Vondřička, P. (2020): KorpusDB: Databáze slovních tvarů a lemmat doložených v korpusech ČNK. Verze 1.0. ÚČNK FF UK, Praha. Dostupný z WWW: <http://korpus.cz/mapka/>.+Vondřička, P. (2020): KorpusDB: Databáze slovních tvarů a lemmat doložených v korpusech ČNK. Verze 1.0. ÚČNK FF UK, Praha. Dostupný z WWW: <http://db.korpus.cz/>.
  
 </WRAP> </WRAP>