Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:oral2008 [2013/11/06 11:04] – [Korpus mluvené češtiny ORAL2008] lukasjanicik | cnk:oral2008 [2018/08/13 15:12] – [Související odkazy] vaclavcvrcek | ||
---|---|---|---|
Řádek 2: | Řádek 2: | ||
====== Korpus mluvené češtiny ORAL2008 ====== | ====== Korpus mluvené češtiny ORAL2008 ====== | ||
- | Korpus | + | Korpus mluvené češtiny |
<WRAP right 35%> | <WRAP right 35%> | ||
^ <fs medium> | ^ <fs medium> | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
- | ^ Počet [[pojmy: | + | ^ Počet [[pojmy: |
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
^ Počet [[pojmy: | ^ Počet [[pojmy: | ||
- | ^ Počet mluvčích | | + | ^ Počet mluvčích | 995 | |
^ Délka nahrávek v min. | 6883 | | ^ Délka nahrávek v min. | 6883 | | ||
</ | </ | ||
===== Složení korpusu ORAL2008 a získávání dat ===== | ===== Složení korpusu ORAL2008 a získávání dat ===== | ||
- | Korpus je sestaven z přepisů 297 nahrávek, které byly v letech 2002-2007 pořízeny na různých místech po celém území Čech (tj. ne Moravy a Slezska). Tyto nahrávky zachycují autentickou mluvenou češtinu v přirozeném prostředí na území tradičně vymezovaném jako oblast českých nářečí v užším slova smyslu. Data umožňují zkoumat především obecnou češtinu a její regionální varianty, všem nahrávkám je totiž společné to, že byly pořízeny výhradně v neformálních situacích, mluvčí se vzájemně znali a měli k sobě přátelský vztah. Mluvčí dále nebyli předem informováni o nahrávání, | + | Korpus je sestaven z přepisů 297 nahrávek, které byly v letech 2002-2007 pořízeny na různých místech po celém území Čech (tj. ne Moravy a Slezska). Tyto nahrávky zachycují autentickou mluvenou češtinu v přirozeném prostředí na území tradičně vymezovaném jako oblast českých nářečí v užším slova smyslu. Data umožňují zkoumat především obecnou češtinu a její regionální varianty, všem nahrávkám je totiž společné to, že byly pořízeny výhradně v neformálních situacích, mluvčí se vzájemně znali a měli k sobě přátelský vztah. Mluvčí dále nebyli předem informováni o nahrávání, |
[[Vložit grafy]] https:// | [[Vložit grafy]] https:// | ||
Řádek 22: | Řádek 22: | ||
==== Přepis nahrávek a další informace ==== | ==== Přepis nahrávek a další informace ==== | ||
- | Pořizování nahrávek, jejich přepisování a označování probíhalo v souladu s [[seznamy:pravidlaprepis|obecnými zásadami]] uplatňovanými při přípravě všech předchozích mluvených korpusů v rámci Českého národního korpusu, zejména korpusu ORAL2006. | + | Pořizování nahrávek, jejich přepisování a označování probíhalo v souladu s [[seznamy:pravidla_2008|obecnými zásadami]] uplatňovanými při přípravě všech předchozích mluvených korpusů v rámci Českého národního korpusu, zejména korpusu ORAL2006. |
Všechny korpusy se shodují v označování základních tří binárních sociolingvistických kategorií mluvčích: | Všechny korpusy se shodují v označování základních tří binárních sociolingvistických kategorií mluvčích: | ||
^ Kategorie ^ zkratky ^ | ^ Kategorie ^ zkratky ^ | ||
^ Pohlaví | M (muž) a Z (žena) | | ^ Pohlaví | M (muž) a Z (žena) | | ||
- | ^ Věk | I (do 35 let) a V (35 let a více) | | + | ^ Věk | I (iunior, mladší, |
- | ^ Vzdělání | B (základní a středoškolské) a A (vysokoškolské včetně pouze započatého) | | + | ^ Vzdělání | B (basis, |
U všech mluvčích jsou (stejně jako v ORALu2006) navíc zpřístupněny i informace o: | U všech mluvčích jsou (stejně jako v ORALu2006) navíc zpřístupněny i informace o: | ||
Řádek 36: | Řádek 36: | ||
=== Oblast převažujícího pobytu do 15 let === | === Oblast převažujícího pobytu do 15 let === | ||
- | Věk 15 let je stanoven jako hranice, kdy se formoval základ individuálního jazykového úzu. Tyto oblasti jsou vymezeny na základě tradičního nářečního členění podle Jaromíra Běliče (Nástin české dialektologie, | + | Věk 15 let je stanoven jako hranice, kdy se formoval základ individuálního jazykového úzu. Tyto oblasti jsou vymezeny na základě tradičního nářečního členění podle Jaromíra Běliče (Nástin české dialektologie, |
+ | [{{ : | ||
+ | |||
+ | Absolutní počty mluvčích podle místa narození i s údaji o zeměpisné šířce a délce jsou k dispozici {{: | ||
===== Změny oproti korpusu ORAL2006 – sociolingvistická vyváženost ===== | ===== Změny oproti korpusu ORAL2006 – sociolingvistická vyváženost ===== | ||
Korpus ORAL2008 je **plně vyvážený s ohledem na základní čtyři sociolingvistické kategorie mluvčích**. Znamená to, že přepisy nahrávek byly do korpusu ORAL2008 vybrány tak, aby byly všechny hodnoty základních sociolingvistických kategorií mluvčích zastoupeny přibližně stejným počtem slov. Polovinou všech slov v korpusu je tedy zastoupena každá z hodnot binárních kategorií: | Korpus ORAL2008 je **plně vyvážený s ohledem na základní čtyři sociolingvistické kategorie mluvčích**. Znamená to, že přepisy nahrávek byly do korpusu ORAL2008 vybrány tak, aby byly všechny hodnoty základních sociolingvistických kategorií mluvčích zastoupeny přibližně stejným počtem slov. Polovinou všech slov v korpusu je tedy zastoupena každá z hodnot binárních kategorií: | ||
Řádek 60: | Řádek 63: | ||
===== Jak citovat ORAL2008 ===== | ===== Jak citovat ORAL2008 ===== | ||
- | <WRAP round tip 30%> | ||
- | //Český národní korpus - ORAL2008//. Ústav Českého národního korpusu FF UK, Praha 2008. Dostupný z WWW: < | ||
- | [[Michal Křen]] | ||
- | </ | ||
+ | <WRAP round tip 70%> | ||
+ | Waclawičová, | ||
+ | |||
+ | Waclawičová, | ||
+ | </ | ||
==== Poděkování ==== | ==== Poděkování ==== | ||
Řádek 73: | Řádek 77: | ||
===== Související odkazy ===== | ===== Související odkazy ===== | ||
+ | |||
<WRAP round box 49%> | <WRAP round box 49%> | ||
- | [[seznamy:pravidlaprepis|Pravidla pro přepis nahrávek]], | + | [[seznamy:index# |
</ | </ |