Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:czesl-man [2020/11/17 12:55] – [Jak citovat CzeSL-man] alexandrrosen | cnk:czesl-man [2020/11/17 14:34] (aktuální) – [CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu] alexandrrosen |
---|
====== CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu ====== | ====== CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu ====== |
| |
Pod názvem //CzeSL-man// je ve vyhledávacím rozhraní [[http://www.korpus.cz/kontext|KonText]] přístupný korpus //CzeSL-man v1 searchable//, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu [[cnk:czesl-plain|CzeSL-SGT]]. Korpus ve formátu anotačního editoru [[https://bitbucket.org/czesl/feat/|feat]] lze pod názvem //CzeSL-man v1 downloadable// získat celý jako data [[https://bitbucket.org/czesl/czesl-man/|zde]]. | Pod názvem //CzeSL-man// je ve vyhledávacím rozhraní [[http://www.korpus.cz/kontext|KonText]] přístupný korpus //CzeSL-man v1 searchable//, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu [[cnk:czesl-sgt|CzeSL-SGT]]. Korpus ve formátu anotačního editoru [[https://bitbucket.org/czesl/feat/|feat]] lze pod názvem //CzeSL-man v1 downloadable// získat celý jako data [[https://bitbucket.org/czesl/czesl-man/|zde]]. |
| |
Ruční chybová anotace //CzeSL-man v1 searchable// je zjednodušenou verzí dvoustupňového anotačního schématu, vytvořeného pro projekt [[http://utkl.ff.cuni.cz/learncorp/|CzeSL]]. Důsledkem zjednodušení je obrácení zdrojového textu a jeho anotace. Výchozí je opravená podoba původního textu. Slova opravené podoby jsou tedy tokeny tohoto korpusu. Původní text je dostupný jako anotace. Nezachovají se přitom všechna slova z původního textu a jejich pořadí může ovlivněno slovosledem opravy. Anotace obsahuje také typy chyb a pro opravený text i morfosyntaktické kategorie, lemmata, závislostní syntaktickou strukturu a funkce. Kromě toho jsou texty vybaveny i metadaty o autorovi a textu. | Ruční chybová anotace //CzeSL-man v1 searchable// je zjednodušenou verzí dvoustupňového anotačního schématu, vytvořeného pro projekt [[http://utkl.ff.cuni.cz/learncorp/|CzeSL]]. Důsledkem zjednodušení je obrácení zdrojového textu a jeho anotace. Výchozí je opravená podoba původního textu. Slova opravené podoby jsou tedy tokeny tohoto korpusu. Původní text je dostupný jako anotace. Nezachovají se přitom všechna slova z původního textu a jejich pořadí může ovlivněno slovosledem opravy. |
| |
| Anotace obsahuje také typy chyb a pro opravený text i morfosyntaktické kategorie, lemmata, závislostní syntaktickou strukturu a funkce. Kromě toho jsou texty vybaveny i metadaty o autorovi a textu. |
| |
Další informace o projektu žákovských korpusů //CzeSL//, včetně přehledu | Další informace o projektu žákovských korpusů //CzeSL//, včetně přehledu |
| |
<WRAP round tip 70%> | <WRAP round tip 70%> |
Bedřichová, Z. - Hana, J. - Hrdlička, M. - Hrdličková, T. - Janeš, P. - Jelínek, T. - Lundáková, K. - Petkevič, V. - Pierscieniak, P. - Poláčková, M. - Rosen, A. - Skoumalová, H. - Sládek, Š. - Šebesta, K. - Škodová, S. - Šormová, K. - Štindlová, B.- Toufarová, D. : //CzeSL-man: korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného chybového schématu, verze v1 searchable z 18. 11. 2020//. Ústav Českého národního korpusu FF UK, Praha 2020. Dostupný z WWW: http://www.korpus.cz | Bedřichová, Z. – Hana, J. – Hrdlička, M. – Hrdličková, T. – Janeš, P. – Jelínek, T. – Lundáková, K. – Petkevič, V. – Pierscieniak, P. – Poláčková, M. – Rosen, A. – Skoumalová, H. – Sládek, Š. – Šebesta, K. – Škodová, S. – Šormová, K. – Štindlová, B. – Toufarová, D. : //CzeSL-man: korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného chybového schématu, verze v1 searchable z 18. 11. 2020//. Ústav Českého národního korpusu FF UK, Praha 2020. Dostupný z WWW: http://www.korpus.cz |
</WRAP> | </WRAP> |
| |
* Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2020-czesl-man-v1s-cs.pdf]] | * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2020-czesl-man-v1s-cs.pdf]] |
| |