AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
cnk:czesl-man [2020/11/17 12:06] – vytvořeno alexandrrosencnk:czesl-man [2020/11/17 14:34] (aktuální) – [CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu] alexandrrosen
Řádek 1: Řádek 1:
 ====== CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu ====== ====== CzeSL-man – korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného víceúrovňového schématu ======
  
-Pod názvem //CzeSL-man// je ve [[http://www.korpus.cz/kontext|vyhledávacím rozhraní KonText]] přístupný korpus //CzeSL-man v1 searchable//, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu [[cnk:czesl-plain|CzeSL-SGT]].+Pod názvem //CzeSL-man// je ve vyhledávacím rozhraní [[http://www.korpus.cz/kontext|KonText]] přístupný korpus //CzeSL-man v1 searchable//, který obsahuje ručně anotované texty nerodilých mluvčích češtiny. Jde o část textů z korpusu [[cnk:czesl-sgt|CzeSL-SGT]]. Korpus ve formátu anotačního editoru [[https://bitbucket.org/czesl/feat/|feat]] lze pod názvem //CzeSL-man v1 downloadable// získat celý jako data  [[https://bitbucket.org/czesl/czesl-man/|zde]]. 
  
-Ruční chybová anotace je zjednodušená verze dvoustupňového (2T) anotačního schématu, vytvořeného pro projekt [[http://utkl.ff.cuni.cz/learncorp/|CzeSL]].  Anotace obsahuje opravy zdrojového textu, typy chyb, morfosyntaktické kategorie lemmata pro opravený text a závislostní syntaktickou strukturu a funkce opraveného textu.  Většina textů je vybavena metadaty o autorovi a textu.+Ruční chybová anotace //CzeSL-man v1 searchable// je zjednodušenou verzí dvoustupňového anotačního schématu, vytvořeného pro projekt [[http://utkl.ff.cuni.cz/learncorp/|CzeSL]]. Důsledkem zjednodušení je obrácení zdrojového textu a jeho anotace. Výchozí je opravená podoba původního textu. Slova opravené podoby jsou tedy tokeny tohoto korpusu. Původní text je dostupný jako anotace. Nezachovají se přitom všechna slova z původního textu a jejich pořadí může ovlivněno slovosledem opravy
  
-Korpus ve verzi //CzeSL-man v1 downloadable// lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]]. Korpus se liší od //CzeSL-man v0// //CzeSL-man v1 downloadable// ve dvou aspektech: (i) neexistují žádné texty s +Anotace obsahuje také typy chyb pro opravený text morfosyntaktické kategorielemmatazávislostní syntaktickou strukturu funkceKromě toho jsou texty vybaveny metadaty o autorovi textu.
-alternativní chybovou anotacíkaždý text je anotován jen jedním +
-anotátorem, a (ii) dvoustupňové anotační schéma je zjednodušeno tak, +
-aby konvenovalo vyhledávacímu nástroji, který je orientován na anotaci +
-po tokenech (slovech)Jinak jsou obsah metadata shodné s korpusem +
-//CzeSL-man v1 downloadable// vyhledávací možnosti jsou podobné +
-jako u //CzeSL-SGT//.+
  
 Další informace o projektu žákovských korpusů //CzeSL//, včetně přehledu Další informace o projektu žákovských korpusů //CzeSL//, včetně přehledu
 všech verzí žákovského korpusu //CzeSL// s odkazy na všech verzí žákovského korpusu //CzeSL// s odkazy na
 možnosti vyhledávání nebo stahování, viz možnosti vyhledávání nebo stahování, viz
-[[http://utkl.ff.cuni.cz/learncorp/]] a \cite{Rosen:etal:2020}.+[[http://utkl.ff.cuni.cz/learncorp/|CzeSL – a Learner Corpus of Czech]] a [[https://dspace.cuni.cz/handle/20.500.11956/123103|Rosen et al. (2020)]].
  
 +===== Jak citovat CzeSL-man =====
 +
 +<WRAP round tip 70%>
 +Bedřichová, Z. – Hana, J. – Hrdlička, M. – Hrdličková, T. – Janeš, P. – Jelínek, T. – Lundáková, K. – Petkevič, V. – Pierscieniak, P. – Poláčková, M. – Rosen, A. – Skoumalová, H. – Sládek, Š. – Šebesta, K. – Škodová, S. – Šormová, K. – Štindlová, B. – Toufarová, D. : //CzeSL-man: korpus češtiny nerodilých mluvčích s ruční chybovou anotací podle zjednodušeného chybového schématu, verze v1 searchable z 18. 11. 2020//. Ústav Českého národního korpusu FF UK, Praha 2020. Dostupný z WWW: http://www.korpus.cz
 +</WRAP>
 +
 +  * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2020-czesl-man-v1s-cs.pdf]]