AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
cnk:czesl-sgt [2014/05/27 11:43] – vytvořeno Alexandr Rosencnk:czesl-sgt [2019/10/31 19:55] (aktuální) – [CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací] Alexandr Rosen
Řádek 1: Řádek 1:
-====== CzeSL-SGT ====== +====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ====== 
-  korpus textů vytvořených studenty češtiny jako cizího jazyka automatickou anotací + 
-  * popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]+Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data a nadto i další texty sebrané v roce 2013. 
 + 
 +Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat s nepřesnostmi a omyly.\\  
 + 
 +Nové texty jsou opatřeny údaji (metadaty) o autorovi a typu textu, ta byla nově doplněna i u velké většiny textů původních. 
 + 
 +Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní KonText]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\ 
 + 
 +===== Jak citovat CzeSL-SGT ===== 
 + 
 +<WRAP round tip 70%> 
 +Šebesta, K. - Bedřichová, Z. - Šormová, K. - Štindlová, B. - Hrdlička, M. - Hrdličková, T. - Hana, J. - Petkevič, V. - Jelínek, T. - Škodová, S. - Poláčková, M. - Janeš, P. - Lundáková, K. - Skoumalová, H. - Sládek, Š. - Pierscieniak, P. - Toufarová, D. - Richter, M. - Straka, M. - Rosen, A.: //CzeSL-SGT: korpus češtiny nerodilých mluvčích automaticky provedenou anotací, verze 2 z 28. 7. 2014//. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupný z WWW: http://www.korpus.cz 
 +</WRAP> 
 + 
 + 
 + 
 +  * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]