AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:czesl-sgt [2014/06/09 16:48] Jan Kocekcnk:czesl-sgt [2019/10/31 19:55] (aktuální) – [CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací] Alexandr Rosen
Řádek 1: Řádek 1:
 ====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ====== ====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ======
  
-Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[http://wiki.korpus.cz/doku.php/cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data, obsahuje však navíc další textysebrané v roce 2013.+Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data a nadto i další texty sebrané v roce 2013.
  
 Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat s nepřesnostmi a omyly.\\  Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat s nepřesnostmi a omyly.\\ 
Řádek 7: Řádek 7:
 Nové texty jsou opatřeny údaji (metadaty) o autorovi a typu textu, ta byla nově doplněna i u velké většiny textů původních. Nové texty jsou opatřeny údaji (metadaty) o autorovi a typu textu, ta byla nově doplněna i u velké většiny textů původních.
  
-Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\+Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní KonText]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\ 
 + 
 +===== Jak citovat CzeSL-SGT ===== 
 + 
 +<WRAP round tip 70%> 
 +Šebesta, K. - Bedřichová, Z. - Šormová, K. - Štindlová, B. - Hrdlička, M. - Hrdličková, T. - Hana, J. - Petkevič, V. - Jelínek, T. - Škodová, S. - Poláčková, M. - Janeš, P. - Lundáková, K. - Skoumalová, H. - Sládek, Š. - Pierscieniak, P. - Toufarová, D. - Richter, M. - Straka, M. - Rosen, A.: //CzeSL-SGT: korpus češtiny nerodilých mluvčích s automaticky provedenou anotací, verze 2 z 28. 7. 2014//. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupný z WWW: http://www.korpus.cz 
 +</WRAP> 
  
  
   * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]   * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]