Následující verze | Předchozí verze |
cnk:hotko [2013/06/20 20:58] – vytvořeno olgarichterova | cnk:hotko [2021/03/04 21:45] (aktuální) – [Jak citovat HOTKO] michalkren |
---|
====== Korpus HOTKO ====== | ====== Korpus HOTKO ====== |
| HOTKO (**HO**rnjoserbski **T**ekstowy **KO**rpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické, beletristické, náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována a prošla [[http://cs.wikipedia.org/wiki/OCR|OCR]], avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není [[pojmy:tag|morfologicky anotován]] ani [[pojmy:lemma|lemmatizován]], což může komplikovat vyhledávání. |
| |
| Podrobnější informace o korpusu najdete na stránce [[http://www.serbski-institut.de/cms/os/48/hornjoserbski]]. |
| |
HOTKO (HOrnjoserbski Tekstowy KOrpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické, beletristické, náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována a prošla OCR, avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není morfologicky anotován ani lematizován, což může komplikovat vyhledávání. | HOTKO je [[pojmy:reprezentativnost|nereferenční]] korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace. |
| |
Podrobnější informace o korpusu najdete na stránce http://www.serbski-institut.de/cms/os/48/hornjoserbski. | Momentálně je aktuální verze 2 z března 2021. |
| |
HOTKO je nereferenční korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace. Další upozornění se týká přístupu ke korpusu: z technických důvodů se korpus HOTKO neobjevuje v nabídce klasického Bonita 1, je přístupný pouze přes webové rozhraní na adrese http://www.korpus.cz/corpora/. | ===== Jak citovat HOTKO ===== |
| <WRAP round tip 30%> |
| Serbski Institut Budyšín: HOTKO: hornolužický textový korpus, verze 2 z 6. 3. 2021. Ústav Českého národního korpusu FF UK, Praha 2021. Dostupný z WWW: <http://www.korpus.cz>. |
| </WRAP> |
| |
| ===== Související odkazy ===== |
| <WRAP round box 49%> |
| [[cnk:dotko|Korpus DOTKO - Dolní lužická srbština]], [[pojmy:diachronni|Diachronie, diachronní korpus]], [[cnk:uvod|Jaké korpusy zpřístupňuje Český národní korpus?]] |
| </WRAP> |