AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:skript2012 [2014/05/28 10:56] jankocekcnk:skript2012 [2015/05/12 15:57] (aktuální) vaclavcvrcek
Řádek 1: Řádek 1:
 ====== Korpus Skript2012 ====== ====== Korpus Skript2012 ======
  
-Řešitelem korpusu **SKRIPT2012** je [[http://ucjtk.ff.cuni.cz/|Ústav českého jazyka a teorie komunikace]] (ÚČJTKUK FF. Korpus vznikal s podporou MSM 0021620825 – Jazyk jako lidská činnostjejí produkt a faktor a Programu rozvoje vědních oblastí na Univerzitě Karlově čP10 Lingvistika, podprogram Osvojování a vývoj jazykové a komunikační kompetence u vybraných komunit České republiky.+Korpus SKRIPT obsahuje celkem 708 668 pozic (bez komentářů v závorce 707 511, bez interpunkce 587 857) a zahrnuje přepisy písemných prací českých žáků, které vznikly v souvislosti s jazykovým vyučováním ve školách základních a středních od 5třídy ZŠ (respekvivalentních ročníků víceletých gymnáziípo poslední ročník gymnáziípodrobněji viz [[cnk:statistiky_ke_korpusu_skript2012|Statistiky ke korpusu SKRIPT2012]]Je to první korpus tohoto typu pro češtinu.
  
-Korpus obsahuje celkem 708 668 pozic (bez komentářů v závorce 707 511, bez interpunkce 587 857) a zahrnuje přepisy písemných prací českých žáků, které vznikly v souvislosti s jazykovým vyučováním ve školách základních a středních od 5. třídy ZŠ (resp. ekvivalentních ročníků víceletých gymnázií) po poslední ročník gymnázií, podrobněji viz [[cnk:statistiky_ke_korpusu_skript2012|Statistiky ke korpusu Skript2012]]. Je to první korpus tohoto typu pro češtinu. +Jde o projevy mluvčích, kteří si češtinu teprve osvojují; korpus **SKRIPT2012** má tedy povahu korpusu [[pojmy:akvizicni_korpus|akvizičního]] a může sloužit jednak výzkumu v oblasti osvojování jazyka (prvního, popř. i jako srovnávací korpus při studiu osvojování češtiny jako jazyka druhého/cizího), jednak pedagogickým účelům.
- +
-Jde o projevy mluvčích, kteří si češtinu teprve osvojují; korpus **SKRIPT2012** má tedy povahu korpusu akvizičního a může sloužit jednak výzkumu v oblasti osvojování jazyka (prvního, popř. i jako srovnávací korpus při studiu osvojování češtiny jako jazyka druhého/cizího), jednak pedagogickým účelům.+
  
 Texty byly sbírány v letech 2008–2010, vznikaly ve školním kontextu, tedy ve formálním prostředí; do korpusu byly zařazeny se souhlasem příslušných institucí a jednotlivců. Písemné práce byly získávány v rukopisné podobě, skenovány a přepisovány do elektronické podoby, podrobněji viz [[cnk:skript2012-prepis|Zásady pro přepis korpusu Skript2012]]. Texty jsou lemmatizovány a opatřeny morfosyntaktickou anotací, pracuje se na jejich anotaci chybové (manuální i automatické). Texty byly sbírány v letech 2008–2010, vznikaly ve školním kontextu, tedy ve formálním prostředí; do korpusu byly zařazeny se souhlasem příslušných institucí a jednotlivců. Písemné práce byly získávány v rukopisné podobě, skenovány a přepisovány do elektronické podoby, podrobněji viz [[cnk:skript2012-prepis|Zásady pro přepis korpusu Skript2012]]. Texty jsou lemmatizovány a opatřeny morfosyntaktickou anotací, pracuje se na jejich anotaci chybové (manuální i automatické).
Řádek 13: Řádek 11:
 Na budování korpusu (sběru a zpracování jazykových dat a metadat) se podíleli v různých pracovních pozicích kromě učitelů základních a středních škol, jejichž podíl byl mimořádně významný, rovněž studenti doktorského a navazujícího magisterského studia FF UK, zejména bohemistických oborů, v závěrečné fázi rovněž pracovníci ÚČNK a ÚTKL. Významná byla spolupráce řady základních a středních škol i individuálních spolupracovníků. Na budování korpusu (sběru a zpracování jazykových dat a metadat) se podíleli v různých pracovních pozicích kromě učitelů základních a středních škol, jejichž podíl byl mimořádně významný, rovněž studenti doktorského a navazujícího magisterského studia FF UK, zejména bohemistických oborů, v závěrečné fázi rovněž pracovníci ÚČNK a ÚTKL. Významná byla spolupráce řady základních a středních škol i individuálních spolupracovníků.
  
-Všem spolupracovníkům za jejich vklad děkujeme. +Řešitelem korpusu **SKRIPT2012** je [[http://ucjtk.ff.cuni.cz/|Ústav českého jazyka a teorie komunikace]] (ÚČJTK) UK FF. Korpus vznikal s podporou MSM 0021620825 – Jazyk jako lidská činnost, její produkt a faktor a Programu rozvoje vědních oblastí na Univerzitě Karlově č. P10 Lingvistika, podprogram Osvojování a vývoj jazykové a komunikační kompetence u vybraných komunit České republiky.
- +
-Za pracovní kolektiv +
- +
- //Karel Šebesta//+
  
 ===Odkazy:=== ===Odkazy:===
  
-  * [[cnk:skript2012-prepis|Zásady pro přepis korpusu Skript2012]]\\  +  * [[cnk:skript2012-prepis|Zásady pro přepis korpusu SKRIPT2012]]\\  
-  * [[cnk:skript2012_znacky|Sociolingvistické a didaktické značky v korpusu SKRIPT2012]]\\ +  * [[cnk:skript2012_znacky|Sociolingvistické značky a charakteristiky v korpusu SRIPT2012]]\\ 
-  * [[cnk:statistiky_ke_korpusu_skript2012|Statistiky ke korpusu Skript2012]]\\ +  * [[cnk:statistiky_ke_korpusu_skript2012|Statistiky ke korpusu SKRIPT2012]]\\ 
   * [[cnk:skript_vyhledavani_a_subkorpusy|Vyhledávání v korpusu SKRIPT2012 a vytváření subkorpusů]]   * [[cnk:skript_vyhledavani_a_subkorpusy|Vyhledávání v korpusu SKRIPT2012 a vytváření subkorpusů]]
  
 +===== Jak citovat =====
 +<WRAP round tip 70%>
 +Šebesta, K. – Goláňová, H. – Jelínek, T. - Jelínková, B. – Křen, M. – Letafková, J. – Procházka, P. – Skoumalová, H.: //SKRIPT2012: akviziční korpus psané češtiny – přepisy písemných prací žáků základních a středních škol v ČR//. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: http://www.korpus.cz
 +</WRAP>
  
  
Řádek 31: Řádek 29:
  
  
-<WRAP round box 49%> +<WRAP round box 75%> 
-[[cnk:schola2010|Korpus vyučovacích hodin SCHOLA2010]][[cnk:czesl-plain|Korpus CZeSL-plain]] +[[cnk:schola2010|SCHOLA2010]] • [[cnk:czesl-plain|CZeSL-plain]] • [[cnk:skript2012-prepis|Zásady pro přepis korpusu Skript2012]] • [[cnk:skript2012_znacky|Sociolingvistické a didaktické značky v korpusu SKRIPT2012]] • [[cnk:statistiky_ke_korpusu_skript2012|Statistiky korpusu SKRIPT2012]] • [[cnk:skript_vyhledavani_a_subkorpusy|Vyhledávání v korpusu SKRIPT2012 a vytváření subkorpusů]]
 </WRAP> </WRAP>