AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:skript2012 [2013/09/24 10:29] olgarichterovacnk:skript2012 [2015/05/12 15:57] (aktuální) vaclavcvrcek
Řádek 1: Řádek 1:
 ====== Korpus Skript2012 ====== ====== Korpus Skript2012 ======
  
 +Korpus SKRIPT obsahuje celkem 708 668 pozic (bez komentářů v závorce 707 511, bez interpunkce 587 857) a zahrnuje přepisy písemných prací českých žáků, které vznikly v souvislosti s jazykovým vyučováním ve školách základních a středních od 5. třídy ZŠ (resp. ekvivalentních ročníků víceletých gymnázií) po poslední ročník gymnázií, podrobněji viz [[cnk:statistiky_ke_korpusu_skript2012|Statistiky ke korpusu SKRIPT2012]]. Je to první korpus tohoto typu pro češtinu.
  
-Řitelem korpusu SKRIPT je [[http://ucjtk.ff.cuni.cz/|Ústav českého jazyka a teorie komunikace]] (ÚČJTK) UK FFKorpus vznikal s podporou MSM 0021620825 – Jazyk jako lidská činnostjejí produkt a faktor a Programu rozvoje vědních oblastí na Univerzitě Karlově č. P10 Lingvistika, podprogram Osvojování a vývoj jazykové a komunikační kompetence u vybraných komunit České republiky.+Jde o projevy mluvčích, kteří si čtinu teprve osvojují; korpus **SKRIPT2012** má tedy povahu korpusu [[pojmy:akvizicni_korpus|akvizičního]] a může sloužit jednak výzkumu v oblasti osvojování jazyka (prvního, popřjako srovnávací korpus při studiu osvojování češtiny jako jazyka druhého/cizího)jednak pedagogickým účelům.
  
-Korpus obsahuje celkem 708 668 pozic (bez komentářů v závorce 707 511bez interpunkce 587 857) zahrnuje episy písemných prací českých žákůkteré vznikly v souvislosti s jazykovým vyučováním ve školách základních a středních od 5třídy ZŠ (resp. ekvivalentních ročníků víceletých gymnáziípo poslední ročník gymnázií. Je to první korpus tohoto typu pro češtinu.+Texty byly sbírány v letech 2008–2010, vznikaly ve školním kontextu, tedy ve formálním prostředí; do korpusu byly zařazeny se souhlasem příslušných institucí a jednotlivců. Písemné práce byly získávány rukopisné podoběskenovány a přepisovány do elektronické podobypodrobněji viz [[cnk:skript2012-prepis|Zásady pro přepis korpusu Skript2012]]Texty jsou lemmatizovány a opatřeny morfosyntaktickou anotací, pracuje se na jejich anotaci chybové (manuální i automatické).
  
-Jde o projevy mluvčích, kteří si češtinu teprve osvojují; korpus SKRIPT2012 má tedy povahu korpusu akvizičního může sloužit jednak výzkumu v oblasti osvojování jazyka (prvníhopopř. i jako srovnávací korpus při studiu osvojování češtiny jako jazyka druhého/cizího)jednak pedagogickým účelům.+Korpus **SKRIPT2012** obsahuje díky svému zaměření užitečné sociolingvistické didaktické informace: o sondě, školetřídě, textu, žáku a učitelipodrobněji viz [[cnk:skript2012_znacky|Sociolingvistické a didaktické značky v korpusu SKRIPT2012]].
  
-Texty byly sbírány v letech 2008–2010, vznikaly ve školním kontextu, tedy ve formálním prostředí; do korpusu byly zařazeny se souhlasem příslušných institucí jednotlivců. Písemné práce byly získávány rukopisné podobě, skenovány přepisovány do elektronické podobyTexty jsou lemmatizovány opatřeny morfosyntaktickou anotací, pracuje se na jejich anotaci chybové (manuální automatické).+Na budování korpusu (sběru a zpracování jazykových dat a metadat) se podíleli v různých pracovních pozicích kromě učitelů základních a středních škol, jejichž podíl byl mimořádně významný, rovněž studenti doktorského navazujícího magisterského studia FF UK, zejména bohemistických oborůzávěrečné fázi rovněž pracovníci ÚČNK ÚTKLVýznamná byla spolupráce řady základních středních škol individuálních spolupracovníků.
  
-Korpus SKRIPT2012 obsahuje díky svému zaměření užitečné sociolingvistické didaktické informace: o sonděškole, třídě, textu, žáku učiteli, podrobněji viz [[seznamy:index|Sociolingvistické a didaktické značky v korpusu SKRIPT2012]].+Řešitelem korpusu **SKRIPT2012** je [[http://ucjtk.ff.cuni.cz/|Ústav českého jazyka teorie komunikace]] (ÚČJTK) UK FF. Korpus vznikal s podporou MSM 0021620825 – Jazyk jako lidská činnostjejí produkt a faktor a Programu rozvoje vědních oblastí na Univerzitě Karlově č. P10 Lingvistikapodprogram Osvojování vývoj jazykové a komunikační kompetence u vybraných komunit České republiky. 
 + 
 +===Odkazy:=== 
 + 
 +  * [[cnk:skript2012-prepis|Zásady pro přepis korpusu SKRIPT2012]]\\  
 +  * [[cnk:skript2012_znacky|Sociolingvistické značky a charakteristiky korpusu SRIPT2012]]\\ 
 +  * [[cnk:statistiky_ke_korpusu_skript2012|Statistiky ke korpusu SKRIPT2012]]\\  
 +  * [[cnk:skript_vyhledavani_a_subkorpusy|Vyhledávání v korpusu SKRIPT2012 a vytváření subkorpusů]] 
 + 
 +===== Jak citovat ===== 
 +<WRAP round tip 70%> 
 +Šebesta, K. – Goláňová, H. – Jelínek, T. - Jelínková, B. – Křen, M. – Letafková, J. – Procházka, P. – Skoumalová, H.: //SKRIPT2012: akviziční korpus psané češtiny – přepisy písemných prací žáků základních a středních škol v ČR//. Ústav Českého národního korpusu FF UK, Praha 2013. Dostupný z WWW: http://www.korpus.cz 
 +</WRAP>
  
-Na budování korpusu (sběru a zpracování jazykových dat a metadat) se podíleli v různých pracovních pozicích kromě učitelů základních a středních škol, jejichž podíl byl mimořádně významný, rovněž studenti doktorského a navazujícího magisterského studia FF UK, zejména bohemistických oborů, v závěrečné fázi rovněž pracovníci ÚČNK a ÚTKL. Významná byla spolupráce řady základních a středních škol i individuálních spolupracovníků. 
  
-Všem spolupracovníkům za jejich vklad děkujeme.+===== Související odkazy =====
  
-Za pracovní kolektiv 
  
- --- //Karel Šebesta//+<WRAP round box 75%> 
 +[[cnk:schola2010|SCHOLA2010]] • [[cnk:czesl-plain|CZeSL-plain]] • [[cnk:skript2012-prepis|Zásady pro přepis korpusu Skript2012]] • [[cnk:skript2012_znacky|Sociolingvistické a didaktické značky v korpusu SKRIPT2012]] • [[cnk:statistiky_ke_korpusu_skript2012|Statistiky korpusu SKRIPT2012]] • [[cnk:skript_vyhledavani_a_subkorpusy|Vyhledávání v korpusu SKRIPT2012 a vytváření subkorpusů]] 
 +</WRAP>