Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:bmk [2013/12/05 02:08] – olgarichterova | cnk:bmk [2022/08/29 17:25] (aktuální) – BatchEdit: pojmy>seznamy promluvy cvrcek |
---|
| ~~NOTOC~~ |
====== Brněnský mluvený korpus ====== | ====== Brněnský mluvený korpus ====== |
| |
| |
<WRAP right 35%> | <WRAP right 35%> |
^ <fs medium>Název</fs> | <fs medium>[[cnk:bmk|BMK]]</fs> | | ^ <fs medium>Název</fs> ^ <fs medium>[[cnk:bmk|BMK]]</fs> ^ |
^ Počet [[pojmy:token|pozic (tokenů)]] | 596 009 | | ^ Počet [[pojmy:token|pozic (tokenů)]] | 596 009 | |
^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek -- slov | 500 460 (([manual:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v korpusu?)) | | ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek -- slov | 500 460((Viz [[kurz:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v korpusu?]])) | |
^ Počet [[pojmy:word| slovních tvarů (wordů)]] | 39 615 | | ^ Počet [[pojmy:word| slovních tvarů (wordů)]] | 39 615 | |
^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] | 250 | | ^ Počet [[seznamy:strukturni_atributy_mluvene|nahrávek rozhovorů]] | 250 | |
^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|promluv]] | 27 921 | | ^ Počet [[seznamy:strukturni_atributy_mluvene|promluv]] | 27 921 | |
^ Počet mluvčích | 294 | | ^ Počet mluvčích | 294 | |
^ Délka nahrávek v min. | <fc #FF0000>není známa</fc> | | ^ Délka nahrávek v min. | <fc #FF0000>N/A</fc> | |
</WRAP> | </WRAP> |
| |
===== Přepis nahrávek a další informace ===== | ===== Přepis nahrávek a další informace ===== |
| |
BMK byl pořizován v souladu se zásadami [[cnk:pmk|PMK]], to znamená tak, aby ve vyvážených proporcích (nahrávky usilovaly o reprezentativní zastoupení všech kombinací) obsáhl čtyři sociolingvistické proměnné: | BMK byl pořizován v souladu se zásadami [[cnk:pmk|PMK]], to znamená tak, aby ve vyvážených proporcích obsáhl čtyři sociolingvistické proměnné (nahrávky usilovaly o reprezentativní zastoupení všech kombinací): |
| |
^ Kategorie ^ zkratky ^ | ^ Kategorie ^ zkratky ^ |
Formální promluvu tvoří monolog vytvářený sledem odpovědí na otázky kladené podle jednotného dotazníku. Otázky se týkaly širokých témat jako škola, mládež, zaměstnání, rodina. **Otázky byly kladeny ve spisovném kódu (na rozdíl od PMK)** a nebyly nahrávány ani přepisovány (přepsány jsou pouze ojedinělé upřesňující vstupy explorátorů, označované jednotnou zkratkou T -- tazatel). Neformální promluvy tvoří dialogy dvou, případně i více mluvčích, kteří se dobře znají. Téma hovoru si volili sami. Jeden z účastníků dialogu byl zpravidla i respondentem ve formální promluvě, což umožňuje sledovat rozdíly češtiny užité v neoficiálních a polooficiálních situacích. V řadě případů byly nahrávky neformálních promluv pořízeny skrytým mikrofonem (jejich zveřejnění bylo mluvčími schváleno dodatečně), takže zaručují velkou míru autenticity a spontánnosti užitého jazyka. | Formální promluvu tvoří monolog vytvářený sledem odpovědí na otázky kladené podle jednotného dotazníku. Otázky se týkaly širokých témat jako škola, mládež, zaměstnání, rodina. **Otázky byly kladeny ve spisovném kódu (na rozdíl od PMK)** a nebyly nahrávány ani přepisovány (přepsány jsou pouze ojedinělé upřesňující vstupy explorátorů, označované jednotnou zkratkou T -- tazatel). Neformální promluvy tvoří dialogy dvou, případně i více mluvčích, kteří se dobře znají. Téma hovoru si volili sami. Jeden z účastníků dialogu byl zpravidla i respondentem ve formální promluvě, což umožňuje sledovat rozdíly češtiny užité v neoficiálních a polooficiálních situacích. V řadě případů byly nahrávky neformálních promluv pořízeny skrytým mikrofonem (jejich zveřejnění bylo mluvčími schváleno dodatečně), takže zaručují velkou míru autenticity a spontánnosti užitého jazyka. |
| |
==== Gramatické značkování BMK ==== | ==== Značkování a BMK ==== |
| |
V současné době probíhá na Fakultě informatiky MU a na Filozofické fakultě MU v Brně gramatické značkování BMK. Využívána je metoda poloautomatické analýzy, práci však komplikuje velká hlásková, tvarová i lexikální variabilita brněnské mluvy (prolínání dialektických, interdialektických, obecněčeských i spisovných podob). V ČNK lze proto s BMK pracovat zatím pouze jako s čistými texty, tj. především vyhledávat zadané konkordance s určitým tvarem nebo kombinací tvarů slova. | Na Fakultě informatiky MU a na Filozofické fakultě MU v Brně proběhlo zkušební morfologické značkování BMK (viz např. Hlaváčková, D.: Korpus mluvené češtiny z brněnského prostředí a jeho morfologické značkování. SaS, 62, 2001, s. 62--70). Využívala se metoda poloautomatické analýzy, práci však komplikovala velká hlásková, tvarová i lexikální variabilita brněnské mluvy (prolínání dialektických, interdialektických, obecněčeských i spisovných podob). V ČNK lze proto s BMK pracovat zatím pouze jako s čistými texty, tj. především vyhledávat zadané konkordance s určitým tvarem nebo kombinací tvarů slova: **prozatím je BMK zpřístupněn bez morfologických značek.** |
| |
| ==== Poděkování ==== |
| |
| Na tvorbě BMK se v různých proporcích podíleli: Zdeňka Hladká, Dana Hlaváčková, Daniel Jedlička a Táňa Vykypělová z Filozofické fakulty Masarykovy univerzity v Brně; s pořizováním nahrávek pomáhala řada studentů FF MU a FSS MU. |
| |
Na Fakultě informatiky MU a na Filozofické fakultě MU v Brně proběhlo zkušební morfologické značkování BMK (viz např. Hlaváčková, D.: Korpus mluvené češtiny z brněnského prostředí a jeho morfologické značkování. SaS, 62, 2001, s. 62-70). **V ČNK je však BMK prozatím uložen bez morfologických značek.** | |
| |
===== Jak citovat BMK ===== | ===== Jak citovat BMK ===== |
<WRAP round tip 30%> | |
Hladká, Z.: BMK (Brněnský mluvený korpus): přepisy nahrávek brněnské mluvy z 90.let 20. století. Ústav Českého národního korpusu FF UK, Praha 2002. Dostupný z WWW: http://www.korpus.cz. | <WRAP round tip 70%> |
| Hladká, Z.: //BMK (Brněnský mluvený korpus): přepisy nahrávek brněnské mluvy z 90.let 20. století//. Ústav Českého národního korpusu FF UK, Praha 2002. Dostupný z WWW: http://www.korpus.cz. |
</WRAP> | </WRAP> |
| |
| |
==== Poděkování ==== | |
Na tvorbě BMK se v různých proporcích podíleli: Zdeňka Hladká, Dana Hlaváčková, Daniel Jedlička a Táňa Vykypělová z Filozofické fakulty Masarykovy univerzity v Brně; s pořizováním nahrávek pomáhala řada studentů FF MU a FSS MU. | |
| |
--- //Zdeňka Hladká//, garant BMK | --- //Zdeňka Hladká//, garant BMK |
| |
| ===== Související odkazy ===== |
| |
| <WRAP round box 49%> |
| [[ORAL2006]] • [[ORAL2008]] • [[ORAL2013]] • [[PMK]] • [[SCHOLA2010]] • [[pojmy:mluveny|Korpus mluveného jazyka]] |
| </WRAP> |