Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:czesl-sgt [2014/06/09 16:52] – jankocek | cnk:czesl-sgt [2015/03/24 10:43] – vaclavcvrcek |
---|
====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ====== | ====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ====== |
| |
Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data, obsahuje však navíc další texty, sebrané v roce 2013. | Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data a nadto i další texty sebrané v roce 2013. |
| |
Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat s nepřesnostmi a omyly.\\ | Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat s nepřesnostmi a omyly.\\ |
| |
Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní KonText]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\ | Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní KonText]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\ |
| |
| ===== Jak citovat CzeSL-SGT ===== |
| |
| <WRAP round tip 70%> |
| Šebesta, K. - Bedřichová, Z. - Šormová, K. - Štindlová, B. - Hrdlička, M. - Hrdličková, T. - Hana, J. - Petkevič, V. - Jelínek, T. - Škodová, S. - Poláčková, M. - Janeš, P. - Lundáková, K. - Skoumalová, H. - Sládek, Š. - Pierscieniak, P. - Toufarová, D. - Richter, M. - Straka, M. - Rosen, A.: //CzeSL-SGT: korpus češtiny nerodilých mluvčích s automaticky provedenou anotací, verze 2 z 28. 7. 2014//. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupný z WWW: http://www.korpus.cz |
| </WRAP> |
| |
| |
| |
* Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]] | * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]] |