Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

cnk:hotko [2013/06/20 20:58]
Olga Richterova vytvořeno
cnk:hotko [2013/12/05 03:32] (aktuální)
Olga Richterova Meziverze
Řádek 1: Řádek 1:
 ====== Korpus HOTKO ====== ====== Korpus HOTKO ======
 +HOTKO (**HO**rnjoserbski **T**ekstowy **KO**rpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické,​ beletristické,​ náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována a prošla [[http://​cs.wikipedia.org/​wiki/​OCR|OCR]],​ avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není [[pojmy:​tag|morfologicky anotován]] ani [[pojmy:​lemma|lemmatizován]],​ což může komplikovat vyhledávání.
  
 +Podrobnější informace o korpusu najdete na stránce [[http://​www.serbski-institut.de/​cms/​os/​48/​hornjoserbski]].
  
-HOTKO (HOrnjoserbski Tekstowy KOrpus) ​je korpus ​horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistickébeletristické,​ náboženské a decké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %)zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována ​prošla OCR, avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není morfologicky anotován ani lematizován,​ což může komplikovat vyhledávání.+HOTKO je [[pojmy:​reprezentativnost|nereferenční]] ​korpus, v plánu je jeho průběžné vylepšovánírozšiřování ​aktualizace
  
-Podrobnější informace o korpusu ​najdete na stránce ​http://www.serbski-institut.de/​cms/​os/​48/​hornjoserbski.+===== Jak citovat HOTKO ===== 
 +<WRAP round tip 30%> 
 +Serbski Institut Budyšín: HOTKO: hornolužický textový korpus, verze 1 z 6. 3. 2013.Ústav Českého národního ​korpusu ​FF UK, Praha 2010. Dostupný z WWW: <http://www.korpus.cz>. 
 +</​WRAP>​
  
-HOTKO je nereferenční korpus, v plánu je jeho průběžné vylepšování,​ rozšiřování a aktualizace. Další upozornění se týká přístupu ke korpusu: z technických důvodů se korpus HOTKO neobjevuje v nabídce klasického Bonita 1, je přístupný pouze přes webové rozhraní na adrese http://​www.korpus.cz/​corpora/​. 
  
 + --- //FIXME autor?//
 +
 +===== Související odkazy =====
 +<WRAP round box 49%>
 +[[cnk:​dotko|Korpus DOTKO - Dolní lužická srbština]],​ [[pojmy:​diachronni|Diachronie,​ diachronní korpus]], [[cnk:​uvod|Jaké korpusy zpřístupňuje Český národní korpus?]]
 +</​WRAP>​