AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
cnk:dotko [2023/09/27 13:16] – [Jak citovat DOTKO] michalkrencnk:dotko [2023/09/27 13:26] (aktuální) – [Korpus DOTKO] michalkren
Řádek 2: Řádek 2:
  
  
-**DOTKO** v2 (**DO**lnoserbski **T**ekstowy **KO**rpus) je rozšířená verze [[pojmy:diachronni|diachronního]] korpusu dolní lužické srbštiny připravovaného v chotěbuzské pobočce Lužickosrbského institutu. Zahrnuje největší část historických dolnolužickosrbských tisků od počátku 18. století do úplného zákazu veřejného užívání lužické srbštiny v roce 1937. Nejstarší text korpusu v tuto chvíli pochází z roku 1706, nejnovější z roku 1936. Podstatnou část tvoří texty Bramborského Casniku (dolnolužických novin) z let 1848 – 1933. Texty byly získány metodou double-keying, a mají tedy poměrně vysokou přesnost přepisu. Největším pokrokem oproti verzi 1 je však normalizace a [[pojmy:lemma|lemmatizace]] textů. Při vhodném nastavení je tedy možné vyhledávat i tvary v dnešním pravopisu, přičemž historické pravopisné podoby jsou podle toho stále vyhledávány. [[pojmy:tag|Morfologické značkování]] zatím nebylo provedeno, což se u některých specifických otázek může ukázat jako problematické.+**DOTKO** v2 (**DO**lnoserbski **T**ekstowy **KO**rpus) je rozšířená verze [[pojmy:diachronni|diachronního]] korpusu dolní lužické srbštiny připravovaného v chotěbuzské pobočce [[http://www.serbski-institut.de/|Lužickosrbského institutu]]. Zahrnuje největší část historických dolnolužickosrbských tisků od počátku 18. století do úplného zákazu veřejného užívání lužické srbštiny v roce 1937. Nejstarší text korpusu v tuto chvíli pochází z roku 1706, nejnovější z roku 1936. Podstatnou část tvoří texty Bramborského Casniku (dolnolužických novin) z let 1848 – 1933. Texty byly získány metodou double-keying, a mají tedy poměrně vysokou přesnost přepisu. Největším pokrokem oproti verzi 1 je však normalizace a [[pojmy:lemma|lemmatizace]] textů. Při vhodném nastavení je tedy možné vyhledávat i tvary v dnešním pravopisu, přičemž historické pravopisné podoby jsou podle toho stále vyhledávány. [[pojmy:tag|Morfologické značkování]] zatím nebylo provedeno, což se u některých specifických otázek může ukázat jako problematické.