AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:dotko [2013/12/05 03:27] olgarichterovacnk:dotko [2023/09/27 13:26] (aktuální) – [Korpus DOTKO] michalkren
Řádek 1: Řádek 1:
- 
 ====== Korpus DOTKO ====== ====== Korpus DOTKO ======
  
  
-**DOTKO** (**DO**lnoserbski **T**ekstowy **KO**rpus) je [[pojmy:diachronni|diachronní]] korpus dolní lužické srbštiny připravovaný Chotěbuzské pobočce Lužickosrbského institutu. Jeho podstatnou část tvoří texty Bramborského Casniku (dolnolužických novin) z let 1848 1933. Všechny texty zatím nebyly zkorigovány jsou prezentovány většinou dobovém pravopisu bez [[pojmy:lemma|lemmat]] [[pojmy:tag|morfologických značek]], což může komplikovat vyhledávání.+**DOTKO** v2 (**DO**lnoserbski **T**ekstowy **KO**rpus) je rozšířená verze [[pojmy:diachronni|diachronního]] korpusu dolní lužické srbštiny připravovaného chotěbuzské pobočce [[http://www.serbski-institut.de/|Lužickosrbského institutu]]. Zahrnuje největší část historických dolnolužickosrbských tisků od počátku 18. století do úplného zákazu veřejného užívání lužické srbštiny v roce 1937. Nejstarší text korpusu v tuto chvíli pochází z roku 1706, nejnovější z roku 1936Podstatnou část tvoří texty Bramborského Casniku (dolnolužických novin) z let 1848 – 1933. Texty byly získány metodou double-keying, mají tedy poměrně vysokou přesnost přepisu. Největším pokrokem oproti verzi 1 je však normalizace a [[pojmy:lemma|lemmatizace]] textů. Při vhodném nastavení je tedy možné vyhledávat i tvary v dnešním pravopisu, přičemž historické pravopisné podoby jsou podle toho stále vyhledávány. [[pojmy:tag|Morfologické značkování]] zatím nebylo provedeno, což se u některých specifických otázek může ukázat jako problematické.
  
-Podrobnější informace o korpusu najdete na stránce http://www.dolnoserbski.de/korpus/. 
  
-DOTKO je [[pojmy:reprezentativnost|nereferenční]] korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace. Další upozornění se týká přístupu ke korpusu: z technických důvodů se korpus DOTKO neobjevuje v nabídce klasického Bonita 1, je přístupný pouze přes webové rozhraní na adrese http://www.korpus.cz/corpora/. 
  
 +Podrobnější informace o korpusu najdete na stránce [[http://www.dolnoserbski.de/korpus/]]. Texty jsou rovněž součástí Dolnolužickosrbské digitální knihovny, více informací naleznete na [[https://www.dolnoserbski.de/biblioteka/informacije/]].
 +
 +
 +DOTKO je [[pojmy:reprezentativnost|nereferenční]] korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace.
  
 ===== Jak citovat DOTKO ===== ===== Jak citovat DOTKO =====
 <WRAP round tip 30%> <WRAP round tip 30%>
-Serbski Institut, Oddělení dolnolužickosrbského výzkumu Chotěbuz: DOTKO: dolnolužický textový korpus, verze 20122010. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: <http://www.korpus.cz>.+Serbski Institut, Oddělení dolnolužickosrbského výzkumu Chotěbuz: DOTKO: dolnolužický textový korpus, verze 2792023. Ústav Českého národního korpusu FF UK, Praha 2023. Dostupný z WWW: <http://www.korpus.cz>.
 </WRAP> </WRAP>
- 
- 
- 
- --- //FIXME autor?// 
  
 ===== Související odkazy ===== ===== Související odkazy =====