AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu

Pod názvem CzeSL-man je ve vyhledávacím rozhraní KonText přístupný korpus CzeSL-man v1 searchable, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu CzeSL-SGT. Korpus ve formátu anotačního editoru feat lze pod názvem CzeSL-man v1 downloadable získat celý jako data zde.

Ruční chybová anotace CzeSL-man v1 searchable je zjednodušenou verzí dvoustupňového anotačního schématu, vytvořeného pro projekt CzeSL. Důsledkem zjednodušení je obrácení zdrojového textu a jeho anotace. Výchozí je opravená podoba původního textu. Slova opravené podoby jsou tedy tokeny tohoto korpusu. Původní text je dostupný jako anotace. Nezachovají se přitom všechna slova z původního textu a jejich pořadí může ovlivněno slovosledem opravy. Anotace obsahuje také typy chyb a pro opravený text i morfosyntaktické kategorie, lemmata, závislostní syntaktickou strukturu a funkce. Kromě toho jsou texty vybaveny i metadaty o autorovi a textu.

Další informace o projektu žákovských korpusů CzeSL, včetně přehledu všech verzí žákovského korpusu CzeSL s odkazy na možnosti vyhledávání nebo stahování, viz CzeSL – a Learner Corpus of Czech a Rosen et al. (2020).

Jak citovat CzeSL-man

Bedřichová, Z. - Hana, J. - Hrdlička, M. - Hrdličková, T. - Janeš, P. - Jelínek, T. - Lundáková, K. - Petkevič, V. - Pierscieniak, P. - Poláčková, M. - Rosen, A. - Skoumalová, H. - Sládek, Š. - Šebesta, K. - Škodová, S. - Šormová, K. - Štindlová, B.- Toufarová, D. : CzeSL-man: korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného chybového schématu, verze v1 searchable z 18. 11. 2020. Ústav Českého národního korpusu FF UK, Praha 2020. Dostupný z WWW: http://www.korpus.cz