Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verze | |
| cnk:hotko [2021/03/04 21:45] – [Jak citovat HOTKO] michalkren | cnk:hotko [2025/07/17 13:36] (aktuální) – [Korpus HOTKO] michalskrabal |
|---|
| HOTKO (**HO**rnjoserbski **T**ekstowy **KO**rpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické, beletristické, náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována a prošla [[http://cs.wikipedia.org/wiki/OCR|OCR]], avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není [[pojmy:tag|morfologicky anotován]] ani [[pojmy:lemma|lemmatizován]], což může komplikovat vyhledávání. | HOTKO (**HO**rnjoserbski **T**ekstowy **KO**rpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické, beletristické, náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována a prošla [[http://cs.wikipedia.org/wiki/OCR|OCR]], avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není [[pojmy:tag|morfologicky anotován]] ani [[pojmy:lemma|lemmatizován]], což může komplikovat vyhledávání. |
| |
| Podrobnější informace o korpusu najdete na stránce [[http://www.serbski-institut.de/cms/os/48/hornjoserbski]]. | Podrobnější informace o korpusu najdete na stránce [[https://www.serbski-institut.de/publikationen/online-publikationen/mehr-obersorbisch/hornjoserbski-tekstowy-korpus-hotko/]]. |
| |
| HOTKO je [[pojmy:reprezentativnost|nereferenční]] korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace. | HOTKO je [[pojmy:reprezentativnost|nereferenční]] korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace. |