AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
cnk:czesl-man [2020/11/17 12:28] alexandrrosencnk:czesl-man [2020/11/17 12:34] alexandrrosen
Řádek 1: Řádek 1:
 ====== CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu ====== ====== CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu ======
  
-Pod názvem //CzeSL-man// je ve vyhledávacím rozhraní [[http://www.korpus.cz/kontext|KonText]] přístupný korpus //CzeSL-man v1 searchable//, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu [[cnk:czesl-plain|CzeSL-SGT]].+Pod názvem //CzeSL-man// je ve vyhledávacím rozhraní [[http://www.korpus.cz/kontext|KonText]] přístupný korpus //CzeSL-man v1 searchable//, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu [[cnk:czesl-plain|CzeSL-SGT]]. Korpus ve formátu anotačního editoru [[https://bitbucket.org/czesl/feat/|feat]] lze pod názvem //CzeSL-man v1 downloadable// získat celý jako data  [[https://bitbucket.org/czesl/czesl-man/|zde]]. 
  
-Ruční chybová anotace tohoto korpusu je zjednodušená verze dvoustupňového anotačního schématu, vytvořeného pro projekt [[http://utkl.ff.cuni.cz/learncorp/|CzeSL]]. Důsledkem je obrácení zdrojového textu a jeho anotace. Výchozí je opravená podoba původního textu. Slova opravené podoby jsou tedy tokeny tohoto korpusu. Původní text je pak dostupný jako anotace. V této anotaci se ale nezachovají všechna slova z původního textu. Také jejich pořadí může ovlivněno slovosledem opravy. +Ruční chybová anotace //CzeSL-man v1 searchable// je zjednodušenou verzí dvoustupňového anotačního schématu, vytvořeného pro projekt [[http://utkl.ff.cuni.cz/learncorp/|CzeSL]]. Důsledkem zjednodušení je obrácení zdrojového textu a jeho anotace. Výchozí je opravená podoba původního textu. Slova opravené podoby jsou tedy tokeny tohoto korpusu. Původní text je dostupný jako anotace. Nezachovají se přitom všechna slova z původního textu jejich pořadí může ovlivněno slovosledem opravy. Anotace obsahuje také typy chyb a pro opravený text i morfosyntaktické kategorie, lemmata, závislostní syntaktickou strukturu a funkce. Kromě toho jsou texty vybaveny metadaty o autorovi a textu.
- +
-Anotace obsahuje také typy chyb a pro opravený text i morfosyntaktické kategorie, lemmata, závislostní syntaktickou strukturu a funkce. Texty jsou vybaveny také metadaty o autorovi a textu+
- +
-Korpus ve formátu anotačního editoru [[https://bitbucket.org/czesl/feat/|feat]] lze pod názvem //CzeSL-man v1 downloadable// získat celý jako data  [[https://bitbucket.org/czesl/czesl-man/|zde]]+
  
 Další informace o projektu žákovských korpusů //CzeSL//, včetně přehledu Další informace o projektu žákovských korpusů //CzeSL//, včetně přehledu