AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:czesl-sgt [2014/05/30 16:04] michalkrencnk:czesl-sgt [2014/06/09 16:48] jankocek
Řádek 1: Řádek 1:
-====== CzeSL-SGT ====== +====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ====== 
-  korpus textů vytvořených studenty češtiny jako cizího jazyka automatickou anotací  + 
-  * popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]+Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[http://wiki.korpus.cz/doku.php/cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data, obsahuje však navíc další texty, sebrané v roce 2013. 
 + 
 +Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat nepřesnostmi a omyly.\\  
 + 
 +Nové texty jsou opatřeny údaji (metadaty) o autorovi a typu textu, ta byla nově doplněna i u velké většiny textů původních. 
 + 
 +Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\ 
 + 
 + 
 +  * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]