Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- cnk:schola2010 [2014/04/09 17:42] – jankocek
+++ cnk:schola2010 [2015/01/21 23:01] – vaclavcvrcek
@@ Řádek 9: / Řádek 9: @@
 ^ <fs medium>Název</fs> | <fs medium>[[cnk:schola2010|SCHOLA2010]]</fs> |
 ^ Počet [[pojmy:token|pozic (tokenů)]] | 1 046 600 |
-^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek | <fc #FF0000>828 038 nebo 792 764 </fc> (([[manual:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v mluveném korpusu?]]))  |
+^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek | <fc #FF0000>828 038 nebo 792 764 </fc> (([[kurz:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v mluveném korpusu?]]))  |
 ^ Počet [[pojmy:word| slovních tvarů (wordů)]] | 64 329 |
 ^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] | 204 |
@@ Řádek 20: / Řádek 20: @@
 ====== Složení korpusu SCHOLA2010 a získávání dat ======
-Korpus SCHOLA2010 tvoří 204 přepisů nahrávek vyučovacích hodin pořízených v letech 2005–2008 na různých místech České republiky, viz [[oddíl Statistiky ke korpusu Schola2010]]. 131 nahrávek bylo nahráno ve středočeské nářeční oblasti, 57 nahrávek ve východomoravské nářeční oblasti ((vymezení nářečních oblastí se opírá o pojetí Běličovo, Nástin české dialektologie, 1972, a o členění nářečních oblastí v Českém jazykovém atlasu, 1992–2005, viz mapa nářečních oblastí podle ČJA)), jde tedy i o teritoriálně různorodý jazykový materiál. Přestože nahrávání probíhalo víceméně ve formálním prostředí, v korpusu SCHOLA2010 se vyskytují i rysy běžně mluveného jazyka. V přepisech vyučovacích hodin je vedle spisovné češtiny poměrně často přítomna obecná čeština a objevují se i regionální prvky. V projevech zaznamenaných ve východní části České republiky je zřejmý vliv dialektu (jsou zde i některé archaické nářeční prvky, např. infinitiv s ť – zkúšať aj.).
+Korpus SCHOLA2010 tvoří 204 přepisů nahrávek vyučovacích hodin pořízených v letech 2005–2008 na různých místech České republiky, viz [[oddíl Statistiky ke korpusu Schola2010]]. 131 nahrávek bylo nahráno ve středočeské nářeční oblasti, 57 nahrávek ve východomoravské nářeční oblasti ((vymezení nářečních oblastí se opírá o pojetí Běličovo, Nástin české dialektologie, 1972, a o členění nářečních oblastí v Českém jazykovém atlasu, 1992–2005)), viz [[:cnk:mapa_narecnich_oblasti.jpg|Mapa nářečních oblastí ČR]], jde tedy i o teritoriálně různorodý jazykový materiál. Přestože nahrávání probíhalo víceméně ve formálním prostředí, v korpusu SCHOLA2010 se vyskytují i rysy běžně mluveného jazyka. V přepisech vyučovacích hodin je vedle spisovné češtiny poměrně často přítomna obecná čeština a objevují se i regionální prvky. V projevech zaznamenaných ve východní části České republiky je zřejmý vliv dialektu (jsou zde i některé archaické nářeční prvky, např. infinitiv s ť – zkúšať aj.).
 Učitelé i žáci o nahrávání dopředu věděli, žáci (případně jejich rodiče) souhlasili s nahráváním i s využitím těchto nahrávek pro potřeby Českého národního korpusu a pro výzkumné účely. V korpusu vyučovacích hodin se vyskytuje 2410 jedinečných mluvčích (osob). Celková délka zaznamenaného zvukového materiálu činí 143 h 25 min. Korpus obsahuje 1 046 600 pozic, z toho je <fc #FF0000>792 764 slov</fc> (bez interpunkce a bez komentářů, které jsou v různých závorkách).
@@ Řádek 68: / Řádek 68: @@
-===Mapa nářečních oblasní ČR===
+===Mapa nářečních oblastí ČR===
-{{:cnk:mapa_narecnich_oblasti.jpg?direct&250| Mapa nářečních oblastí podle ČJA}}
+{{:cnk:mapa_narecnich_oblasti.jpg?direct&250| Mapa nářečních oblastí ČR}}
@@ Řádek 78: / Řádek 78: @@
 ===== Jak citovat =====
-[[Karel Šebesta?]]
+Šebesta, K. – Goláňová, H. – Křen, M. – Procházka, P.: SCHOLA2010: korpus mluvené češtiny ve škole – přepisy nahrávek vyučovacích hodin na českých základních a středních školách. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz
@@ Řádek 84: / Řádek 86: @@
 ===== Související odkazy =====
-<WRAP round box 49%>
- [[ORAL2006]], [[ORAL2008]], [[ORAL2013]], [[PMK]], [[BMK]], [[cnk:czesl-plain|Korpus CZeSL-plain]], [[cnk:skript2012|Korpus Skript2012]], [[pojmy:mluveny|Korpus mluveného jazyka]]
+<WRAP round box 69%>
+[[ORAL2006]] • [[ORAL2008]] • [[ORAL2013]] • [[PMK]] • [[BMK]] • [[cnk:czesl-plain|Korpus CZeSL-plain]] • [[cnk:skript2012|Korpus Skript2012]] • [[pojmy:mluveny|Korpus mluveného jazyka]]
 </WRAP>

Historie:

Rozdíly

Hledat

Navigace

Tisk/export

Nástroje

Jazyky

Licence