AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:schola2010 [2015/01/23 16:21] vaclavcvrcekcnk:schola2010 [2022/08/29 17:25] (aktuální) – BatchEdit: pojmy>seznamy promluvy cvrcek
Řádek 11: Řádek 11:
 ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek | <fc #FF0000>828 038 nebo 792 764 </fc> (([[kurz:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v mluveném korpusu?]]))  | ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek | <fc #FF0000>828 038 nebo 792 764 </fc> (([[kurz:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v mluveném korpusu?]]))  |
 ^ Počet [[pojmy:word| slovních tvarů (wordů)]] | 64 329 |   ^ Počet [[pojmy:word| slovních tvarů (wordů)]] | 64 329 |  
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] | 204 | +^ Počet [[seznamy:strukturni_atributy_mluvene|nahrávek rozhovorů]] | 204 | 
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|promluv]] | 61 285 |+^ Počet [[seznamy:strukturni_atributy_mluvene|promluv]] | 61 285 |
 ^ Počet mluvčích | 2410 |   ^ Počet mluvčích | 2410 |  
 ^ Délka nahrávek v min. | 8605 |   ^ Délka nahrávek v min. | 8605 |  
Řádek 20: Řádek 20:
 ====== Složení korpusu SCHOLA2010 a získávání dat ====== ====== Složení korpusu SCHOLA2010 a získávání dat ======
  
-Korpus SCHOLA2010 tvoří 204 přepisů nahrávek vyučovacích hodin pořízených v letech 2005–2008 na různých místech České republiky, viz [[oddíl Statistiky ke korpusu Schola2010]]. 131 nahrávek bylo nahráno ve středočeské nářeční oblasti, 57 nahrávek ve východomoravské nářeční oblasti ((vymezení nářečních oblastí se opírá o pojetí Běličovo, Nástin české dialektologie, 1972, a o členění nářečních oblastí v Českém jazykovém atlasu, 1992–2005)), viz [[:cnk:mapa_narecnich_oblasti.jpg|Mapa nářečních oblastí ČR]], jde tedy i o teritoriálně různorodý jazykový materiál. Přestože nahrávání probíhalo víceméně ve formálním prostředí, v korpusu SCHOLA2010 se vyskytují i rysy běžně mluveného jazyka. V přepisech vyučovacích hodin je vedle spisovné češtiny poměrně často přítomna obecná čeština a objevují se i regionální prvky. V projevech zaznamenaných ve východní části České republiky je zřejmý vliv dialektu (jsou zde i některé archaické nářeční prvky, např. infinitiv s ť – zkúšať aj.). +Korpus SCHOLA2010 tvoří 204 přepisů nahrávek vyučovacích hodin pořízených v letech 2005–2008 na různých místech České republiky, viz [[oddíl Statistiky ke korpusu Schola2010]]. 131 nahrávek bylo nahráno ve středočeské nářeční oblasti, 57 nahrávek ve východomoravské nářeční oblasti ((vymezení nářečních oblastí se opírá o pojetí Běličovo, Nástin české dialektologie, 1972, a o členění nářečních oblastí v Českém jazykovém atlasu, 1992–2005)), viz {{:cnk:mapa_narecnich_oblasti-velka.jpg?linkonly|Mapa nářečních oblastí ČR}}, jde tedy i o teritoriálně různorodý jazykový materiál. Přestože nahrávání probíhalo víceméně ve formálním prostředí, v korpusu SCHOLA2010 se vyskytují i rysy běžně mluveného jazyka. V přepisech vyučovacích hodin je vedle spisovné češtiny poměrně často přítomna obecná čeština a objevují se i regionální prvky. V projevech zaznamenaných ve východní části České republiky je zřejmý vliv dialektu (jsou zde i některé archaické nářeční prvky, např. infinitiv s ť – //zkúšať// aj.). 
-Učitelé i žáci o nahrávání dopředu věděli, žáci (případně jejich rodiče) souhlasili s nahráváním i s využitím těchto nahrávek pro potřeby Českého národního korpusu a pro výzkumné účely. V korpusu vyučovacích hodin se vyskytuje 2410 jedinečných mluvčích (osob). Celková délka zaznamenaného zvukového materiálu činí 143 h 25 min. Korpus obsahuje 1 046 600 pozic, z toho je <fc #FF0000>792 764 slov</fc> (bez interpunkce a bez komentářů, které jsou v různých závorkách).+ 
 +Učitelé i žáci o nahrávání dopředu věděli, žáci (případně jejich rodiče) souhlasili s nahráváním i s využitím těchto nahrávek pro potřeby Českého národního korpusu a pro výzkumné účely. V korpusu vyučovacích hodin se vyskytuje 2410 jedinečných mluvčích (osob). Celková délka zaznamenaného zvukového materiálu činí 143 h 25 min. Korpus obsahuje 1 046 600 pozic, z toho je **792 764 slov** (bez interpunkce a bez komentářů, které jsou v různých závorkách).
  
 ===== Výběr škol a vyučovacích předmětů ===== ===== Výběr škol a vyučovacích předmětů =====
Řádek 69: Řádek 70:
  
 ===Mapa nářečních oblastí ČR=== ===Mapa nářečních oblastí ČR===
-{{:cnk:mapa_narecnich_oblasti.jpg?direct&250| Mapa nářečních oblastí ČR}}+ 
 +{{:cnk:oblasti_ridsi_mod2.jpg?direct&500| Mapa nářečních oblastí ČR}}