AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:czesl-sgt [2014/06/09 16:48] jankocekcnk:czesl-sgt [2014/06/09 16:52] jankocek
Řádek 1: Řádek 1:
 ====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ====== ====== CzeSL-SGT – korpus češtiny nerodilých mluvčích s automaticky provedenou anotací ======
  
-Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[http://wiki.korpus.cz/doku.php/cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data, obsahuje však navíc další texty, sebrané v roce 2013.+Žákovský korpus CzeSL-SGT (//**Cze**ch as a **S**econd **L**anguage with **S**pelling, **G**rammar and **T**ags//) obsahuje přepisy písemných prací nerodilých mluvčích češtiny. Navazuje tak na část CIZ korpusu [[cnk:czesl-plain|CzeSL-plain]]: obsahuje její jazyková data, obsahuje však navíc další texty, sebrané v roce 2013.
  
 Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat s nepřesnostmi a omyly.\\  Slovní tvary jsou označeny slovním druhem, morfologickými kategoriemi a základním tvarem (lemmatem). Některé tvary jsou opraveny a výsledná podoba textu znovu slovnědruhově a morfologicky označena. Na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby. Všechny tyto údaje jsou určeny automaticky, je tedy třeba počítat s nepřesnostmi a omyly.\\ 
Řádek 7: Řádek 7:
 Nové texty jsou opatřeny údaji (metadaty) o autorovi a typu textu, ta byla nově doplněna i u velké většiny textů původních. Nové texty jsou opatřeny údaji (metadaty) o autorovi a typu textu, ta byla nově doplněna i u velké většiny textů původních.
  
-Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\+Korpus lze prohledávat on-line přes [[http://www.korpus.cz/kontext|vyhledávací rozhraní KonText]] Českého národního korpusu (dostupné na portálu [[http://korpus.cz|korpus.cz]]), nebo ho lze získat celý jako data ze serveru [[http://www.lindat.cz|LINDAT]].\\
  
  
   * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]   * Podrobný popis korpusu: [[http://utkl.ff.cuni.cz/~rosen/public/2014-czesl-sgt-cs.pdf]]