AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Korpus HOTKO

HOTKO (HOrnjoserbski Tekstowy KOrpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické, beletristické, náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována a prošla OCR, avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není morfologicky anotován ani lemmatizován, což může komplikovat vyhledávání.

Podrobnější informace o korpusu najdete na stránce http://www.serbski-institut.de/cms/os/48/hornjoserbski.

HOTKO je nereferenční korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace.

Jak citovat HOTKO

Serbski Institut Budyšín: HOTKO: hornolužický textový korpus, verze 1 z 6. 3. 2013.Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: <http://www.korpus.cz>.

FIXME autor?

Související odkazy