Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
cnk:oral2008 [2013/12/09 00:35] – [Korpus mluvené češtiny ORAL2008] michalkren | cnk:oral2008 [2022/08/29 17:25] (aktuální) – BatchEdit: pojmy>seznamy promluvy cvrcek | ||
---|---|---|---|
Řádek 2: | Řádek 2: | ||
====== Korpus mluvené češtiny ORAL2008 ====== | ====== Korpus mluvené češtiny ORAL2008 ====== | ||
- | Korpus mluvené češtiny **ORAL2008** zachycuje stejně jako [[ORAL2006]] mluvu ve výhradně neformálních, | + | Korpus mluvené češtiny **ORAL2008** zachycuje stejně jako [[ORAL2006]] mluvu ve výhradně neformálních, |
<WRAP right 35%> | <WRAP right 35%> | ||
Řádek 9: | Řádek 9: | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
- | ^ Počet [[pojmy:atributy_strukturni# | + | ^ Počet [[seznamy:strukturni_atributy_mluvene|nahrávek rozhovorů]] | 297 | |
- | ^ Počet [[pojmy:atributy_strukturni# | + | ^ Počet [[seznamy:strukturni_atributy_mluvene|promluv]] | 106 941 | |
^ Počet mluvčích | 995 | | ^ Počet mluvčích | 995 | | ||
^ Délka nahrávek v min. | 6883 | | ^ Délka nahrávek v min. | 6883 | | ||
Řádek 18: | Řádek 18: | ||
Korpus je sestaven z přepisů 297 nahrávek, které byly v letech 2002-2007 pořízeny na různých místech po celém území Čech (tj. ne Moravy a Slezska). Tyto nahrávky zachycují autentickou mluvenou češtinu v přirozeném prostředí na území tradičně vymezovaném jako oblast českých nářečí v užším slova smyslu. Data umožňují zkoumat především obecnou češtinu a její regionální varianty, všem nahrávkám je totiž společné to, že byly pořízeny výhradně v neformálních situacích, mluvčí se vzájemně znali a měli k sobě přátelský vztah. Mluvčí dále nebyli předem informováni o nahrávání, | Korpus je sestaven z přepisů 297 nahrávek, které byly v letech 2002-2007 pořízeny na různých místech po celém území Čech (tj. ne Moravy a Slezska). Tyto nahrávky zachycují autentickou mluvenou češtinu v přirozeném prostředí na území tradičně vymezovaném jako oblast českých nářečí v užším slova smyslu. Data umožňují zkoumat především obecnou češtinu a její regionální varianty, všem nahrávkám je totiž společné to, že byly pořízeny výhradně v neformálních situacích, mluvčí se vzájemně znali a měli k sobě přátelský vztah. Mluvčí dále nebyli předem informováni o nahrávání, | ||
- | [[Vložit grafy]] https://www.korpus.cz/ | + | |
+ | **Tab 1**. Počet nahrávek podle roků | ||
+ | ^ Rok ^ Počet nahrávek ^ | ||
+ | |2002 | 9| | ||
+ | |2003 | 7| | ||
+ | |2004 | 11| | ||
+ | |2005 | 49| | ||
+ | |2006 | 79| | ||
+ | |2007 | | ||
+ | |||
+ | **Tab 2**. Počet nahrávek podle počtu mluvčích | ||
+ | |||
+ | ^ Počet mluvčích ^ Počet nahrávek ^ | ||
+ | |2| 109| | ||
+ | |3| 76| | ||
+ | |4| 54| | ||
+ | |5| 33| | ||
+ | |6| 15| | ||
+ | |7| 5| | ||
+ | |8| 3| | ||
+ | |9| 1| | ||
+ | |10| 1| | ||
+ | |||
+ | **Tab 3**. Počet mluvčích a pozic podle vzdělání | ||
+ | ^Vzdělání ^ Počet mluvčích ^ Počet pozic ^ | ||
+ | |A| 559| 500672| | ||
+ | |B| 436| 499425| | ||
+ | |ZŠ| 130| 163988| | ||
+ | |SŠ| 306| 335437| | ||
+ | |VŠ| 559| 500672| | ||
+ | |||
+ | **Tab 4**. Počet mluvčích a pozic podle pohlaví | ||
+ | ^Pohlaví ^ Počet mluvčích ^ Počet pozic ^ | ||
+ | |ženy | 522| 500478| | ||
+ | |muži | 473| 499619| | ||
+ | |||
+ | **Tab 5**. Počet mluvčích a pozic podle věku | ||
+ | ^Věk ^ Počet mluvčích ^ Počet pozic ^ | ||
+ | |I | 576| 500199| | ||
+ | |V | 419| 499898| | ||
+ | |||
+ | **Tab 6**. Počet mluvčích a pozic podle nářečních oblastí | ||
+ | ^Nářeční oblast ^ Počet mluvčích ^ Počet pozic ^ | ||
+ | |středočeská| | ||
+ | |severovýchodočeská| | ||
+ | |jihozápadočeská| | ||
+ | |české pohraničí| | ||
+ | |česko-moravská| | ||
==== Přepis nahrávek a další informace ==== | ==== Přepis nahrávek a další informace ==== | ||
- | Pořizování nahrávek, jejich přepisování a označování probíhalo v souladu s [[seznamy:pravidlaprepis|obecnými zásadami]] uplatňovanými při přípravě všech předchozích mluvených korpusů v rámci Českého národního korpusu, zejména korpusu ORAL2006. | + | Pořizování nahrávek, jejich přepisování a označování probíhalo v souladu s [[seznamy:pravidla_2008|obecnými zásadami]] uplatňovanými při přípravě všech předchozích mluvených korpusů v rámci Českého národního korpusu, zejména korpusu ORAL2006. |
Všechny korpusy se shodují v označování základních tří binárních sociolingvistických kategorií mluvčích: | Všechny korpusy se shodují v označování základních tří binárních sociolingvistických kategorií mluvčích: | ||
Řádek 36: | Řádek 84: | ||
=== Oblast převažujícího pobytu do 15 let === | === Oblast převažujícího pobytu do 15 let === | ||
- | Věk 15 let je stanoven jako hranice, kdy se formoval základ individuálního jazykového úzu. Tyto oblasti jsou vymezeny na základě tradičního nářečního členění podle Jaromíra Běliče (Nástin české dialektologie, | + | Věk 15 let je stanoven jako hranice, kdy se formoval základ individuálního jazykového úzu. Tyto oblasti jsou vymezeny na základě tradičního nářečního členění podle Jaromíra Běliče (Nástin české dialektologie, |
+ | [{{ : | ||
+ | |||
+ | Absolutní počty mluvčích podle místa narození i s údaji o zeměpisné šířce a délce jsou k dispozici {{: | ||
===== Změny oproti korpusu ORAL2006 – sociolingvistická vyváženost ===== | ===== Změny oproti korpusu ORAL2006 – sociolingvistická vyváženost ===== | ||
Korpus ORAL2008 je **plně vyvážený s ohledem na základní čtyři sociolingvistické kategorie mluvčích**. Znamená to, že přepisy nahrávek byly do korpusu ORAL2008 vybrány tak, aby byly všechny hodnoty základních sociolingvistických kategorií mluvčích zastoupeny přibližně stejným počtem slov. Polovinou všech slov v korpusu je tedy zastoupena každá z hodnot binárních kategorií: | Korpus ORAL2008 je **plně vyvážený s ohledem na základní čtyři sociolingvistické kategorie mluvčích**. Znamená to, že přepisy nahrávek byly do korpusu ORAL2008 vybrány tak, aby byly všechny hodnoty základních sociolingvistických kategorií mluvčích zastoupeny přibližně stejným počtem slov. Polovinou všech slov v korpusu je tedy zastoupena každá z hodnot binárních kategorií: | ||
Řádek 60: | Řádek 111: | ||
===== Jak citovat ORAL2008 ===== | ===== Jak citovat ORAL2008 ===== | ||
- | <WRAP round tip 30%> | ||
- | Waclawičová, | ||
- | </ | ||
+ | <WRAP round tip 70%> | ||
+ | Waclawičová, | ||
+ | |||
+ | Waclawičová, | ||
+ | </ | ||
==== Poděkování ==== | ==== Poděkování ==== | ||
Řádek 72: | Řádek 125: | ||
===== Související odkazy ===== | ===== Související odkazy ===== | ||
+ | |||
<WRAP round box 49%> | <WRAP round box 49%> | ||
- | [[seznamy:pravidlaprepis|Pravidla pro přepis nahrávek]], | + | [[seznamy:index# |
</ | </ |