AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu

Pod názvem CzeSL-man je ve vyhledávacím rozhraní KonText přístupný korpus CzeSL-man v1 searchable, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu CzeSL-SGT.

Ruční chybová anotace tohoto korpusu je zjednodušená verze dvoustupňového anotačního schématu, vytvořeného pro projekt CzeSL. Důsledkem je obrácení zdrojového textu a jeho anotace. Výchozí je opravená podoba původního textu. Slova opravené podoby jsou tedy tokeny tohoto korpusu. Původní text je pak dostupný jako anotace. V této anotaci se ale nezachovají všechna slova z původního textu. Také jejich pořadí může ovlivněno slovosledem opravy.

Anotace obsahuje také typy chyb a pro opravený text i morfosyntaktické kategorie, lemmata, závislostní syntaktickou strukturu a funkce. Texty jsou vybaveny také metadaty o autorovi a textu.

Korpus ve formátu anotačního editoru feat lze pod názvem CzeSL-man v1 downloadable získat celý jako data zde.

Další informace o projektu žákovských korpusů CzeSL, včetně přehledu všech verzí žákovského korpusu CzeSL s odkazy na možnosti vyhledávání nebo stahování, viz CzeSL – a Learner Corpus of Czech a Rosen et al. (2020).