~~NOTOC~~ ====== Brněnský mluvený korpus ====== **Brněnský mluvený korpus** (BMK) je v rámci ČNK prvním korpusem mluvené češtiny z oblasti Moravy. Zaznamenává autentickou tematicky nespecializovanou mluvu města Brna. BMK je elektronickým přepisem dvou set padesáti anonymních magnetofonových nahrávek z let 1994--1999 zachycujících téměř tři sta mluvčích. ^ Název ^ [[cnk:bmk|BMK]] ^ ^ Počet [[pojmy:token|pozic (tokenů)]] | 596 009 | ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek -- slov | 500 460((Viz [[kurz:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v korpusu?]])) | ^ Počet [[pojmy:word| slovních tvarů (wordů)]] | 39 615 | ^ Počet [[seznamy:strukturni_atributy_mluvene|nahrávek rozhovorů]] | 250 | ^ Počet [[seznamy:strukturni_atributy_mluvene|promluv]] | 27 921 | ^ Počet mluvčích | 294 | ^ Délka nahrávek v min. | N/A | ===== Povaha brněnštiny ===== Značná pestrost brněnské mluvené češtiny odráží složitost sociální struktury velkoměsta, ústřední postavení Brna v rámci Moravy (dochází zde k míšení obyvatel z celého dosud nářečně diferencovaného regionu) a dále teritoriální blízkost k jazykovému území vlastních Čech. V běžné mluvě Brňanů se prolíná zejména středomoravský interdialekt s pronikající obecnou češtinou (s níž se v řadě rysů tradiční dialekt okolí města shoduje), v oblasti slovní zásoby jsou patrny relikty někdejšího soužití brněnské češtiny s německým jazykem a vliv brněnského slangu (hantecu). Mluvený jazyk v Brně reflektuje také celomoravskou tendenci širšího funkčního využití češtiny spisovné. ===== Přepis nahrávek a další informace ===== BMK byl pořizován v souladu se zásadami [[cnk:pmk|PMK]], to znamená tak, aby ve vyvážených proporcích obsáhl čtyři sociolingvistické proměnné (nahrávky usilovaly o reprezentativní zastoupení všech kombinací): ^ Kategorie ^ zkratky ^ ^ Pohlaví | M (muž) a Z (žena) | ^ Věk | I (mladší: ca 20--35 let) a V (starší: 35 let a více) | ^ Vzdělání | B (basis, základní a středoškolské) a A (altus, vysokoškolské včetně pouze započatého) | ^ Typ promluvy | F (formální: 135 nahrávek) a N (neformální: 115 nahrávek) | Každá nahrávka je dále doplněna zpřesňujícími informacemi o mluvčích, o roku svého vzniku, případně relevantními údaji o situaci promluvy. [[seznamy:index|Způsob přepisu nahrávek]] je patrný z textu. Snažil se o co nejvěrnější, ale zároveň i nejsrozumitelnější zachycení mluveného jazyka. Přizpůsoboval se též požadavkům softwarových nástrojů pro automatickou analýzu textu. Nebyl proto užit přepis dialektologický (fonetický), nýbrž účelová kombinace fonetického zápisu a standardních pravopisných norem. V jednotlivých textech se pochopitelně objevuje kolísání, odrážející mj. individuální přístupy přepisovatelů (zčásti studentů). Pravidla přepisu v základních obrysech odpovídají pravidlům užívaným v PMK, diference spočívají především v pokusu o nahrazení tradiční interpunkce interpunkcí "pauzovou" a v zachycení simultánnosti dialogických promluv (viz [[seznamy:pravidlaprepispmk|Zásady přepisu]]). ==== Formální a neformální promluvy ==== Formální promluvu tvoří monolog vytvářený sledem odpovědí na otázky kladené podle jednotného dotazníku. Otázky se týkaly širokých témat jako škola, mládež, zaměstnání, rodina. **Otázky byly kladeny ve spisovném kódu (na rozdíl od PMK)** a nebyly nahrávány ani přepisovány (přepsány jsou pouze ojedinělé upřesňující vstupy explorátorů, označované jednotnou zkratkou T -- tazatel). Neformální promluvy tvoří dialogy dvou, případně i více mluvčích, kteří se dobře znají. Téma hovoru si volili sami. Jeden z účastníků dialogu byl zpravidla i respondentem ve formální promluvě, což umožňuje sledovat rozdíly češtiny užité v neoficiálních a polooficiálních situacích. V řadě případů byly nahrávky neformálních promluv pořízeny skrytým mikrofonem (jejich zveřejnění bylo mluvčími schváleno dodatečně), takže zaručují velkou míru autenticity a spontánnosti užitého jazyka. ==== Značkování a BMK ==== Na Fakultě informatiky MU a na Filozofické fakultě MU v Brně proběhlo zkušební morfologické značkování BMK (viz např. Hlaváčková, D.: Korpus mluvené češtiny z brněnského prostředí a jeho morfologické značkování. SaS, 62, 2001, s. 62--70). Využívala se metoda poloautomatické analýzy, práci však komplikovala velká hlásková, tvarová i lexikální variabilita brněnské mluvy (prolínání dialektických, interdialektických, obecněčeských i spisovných podob). V ČNK lze proto s BMK pracovat zatím pouze jako s čistými texty, tj. především vyhledávat zadané konkordance s určitým tvarem nebo kombinací tvarů slova: **prozatím je BMK zpřístupněn bez morfologických značek.** ==== Poděkování ==== Na tvorbě BMK se v různých proporcích podíleli: Zdeňka Hladká, Dana Hlaváčková, Daniel Jedlička a Táňa Vykypělová z Filozofické fakulty Masarykovy univerzity v Brně; s pořizováním nahrávek pomáhala řada studentů FF MU a FSS MU. ===== Jak citovat BMK ===== Hladká, Z.: //BMK (Brněnský mluvený korpus): přepisy nahrávek brněnské mluvy z 90.let 20. století//. Ústav Českého národního korpusu FF UK, Praha 2002. Dostupný z WWW: http://www.korpus.cz. --- //Zdeňka Hladká//, garant BMK ===== Související odkazy ===== [[ORAL2006]] • [[ORAL2008]] • [[ORAL2013]] • [[PMK]] • [[SCHOLA2010]] • [[pojmy:mluveny|Korpus mluveného jazyka]]