AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:bmk [2013/12/05 02:08] olgarichterovacnk:bmk [2022/08/29 17:25] (aktuální) – BatchEdit: pojmy>seznamy promluvy cvrcek
Řádek 1: Řádek 1:
 +~~NOTOC~~
 ====== Brněnský mluvený korpus ====== ====== Brněnský mluvený korpus ======
  
Řádek 4: Řádek 5:
  
 <WRAP right 35%> <WRAP right 35%>
-^ <fs medium>Název</fs> <fs medium>[[cnk:bmk|BMK]]</fs> | +^ <fs medium>Název</fs> <fs medium>[[cnk:bmk|BMK]]</fs> ^ 
-^ Počet [[pojmy:token|pozic (tokenů)]] |   596 009  |   +^ Počet [[pojmy:token|pozic (tokenů)]] |   596 009 |   
-^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek -- slov |  500  460 (([manual:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v korpusu?)) |+^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek -- slov |  500  460((Viz [[kurz:chvala_korpusu?&#hledame_veskerou_interpunkci_v_mluvenem_korpusu_pocet_pozic_obsazenych_slovy|Jak spočítat počet slov v korpusu?]])) |
 ^ Počet [[pojmy:word| slovních tvarů (wordů)]] |  39 615 |   ^ Počet [[pojmy:word| slovních tvarů (wordů)]] |  39 615 |  
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|nahrávek rozhovorů]] |  250 | +^ Počet [[seznamy:strukturni_atributy_mluvene|nahrávek rozhovorů]] |  250 | 
-^ Počet [[pojmy:atributy_strukturni#struktura_korpusu_mluvene_cestiny|promluv]] |  27 921 |+^ Počet [[seznamy:strukturni_atributy_mluvene|promluv]] |  27 921 |
 ^ Počet mluvčích |  294 |   ^ Počet mluvčích |  294 |  
-^ Délka nahrávek v min. |  <fc #FF0000>není známa</fc> |  +^ Délka nahrávek v min. |  <fc #FF0000>N/A</fc> |  
 </WRAP> </WRAP>
  
Řádek 20: Řádek 21:
 ===== Přepis nahrávek a další informace ===== ===== Přepis nahrávek a další informace =====
  
-BMK byl pořizován v souladu se zásadami [[cnk:pmk|PMK]], to znamená tak, aby ve vyvážených proporcích (nahrávky usilovaly o reprezentativní zastoupení všech kombinací) obsáhl čtyři sociolingvistické proměnné+BMK byl pořizován v souladu se zásadami [[cnk:pmk|PMK]], to znamená tak, aby ve vyvážených proporcích obsáhl čtyři sociolingvistické proměnné (nahrávky usilovaly o reprezentativní zastoupení všech kombinací): 
  
 ^ Kategorie ^ zkratky ^ ^ Kategorie ^ zkratky ^
Řádek 37: Řádek 38:
 Formální promluvu tvoří monolog vytvářený sledem odpovědí na otázky kladené podle jednotného dotazníku. Otázky se týkaly širokých témat jako škola, mládež, zaměstnání, rodina. **Otázky byly kladeny ve spisovném kódu (na rozdíl od PMK)** a nebyly nahrávány ani přepisovány (přepsány jsou pouze ojedinělé upřesňující vstupy explorátorů, označované jednotnou zkratkou T -- tazatel). Neformální promluvy tvoří dialogy dvou, případně i více mluvčích, kteří se dobře znají. Téma hovoru si volili sami. Jeden z účastníků dialogu byl zpravidla i respondentem ve formální promluvě, což umožňuje sledovat rozdíly češtiny užité v neoficiálních a polooficiálních situacích. V řadě případů byly nahrávky neformálních promluv pořízeny skrytým mikrofonem (jejich zveřejnění bylo mluvčími schváleno dodatečně), takže zaručují velkou míru autenticity a spontánnosti užitého jazyka. Formální promluvu tvoří monolog vytvářený sledem odpovědí na otázky kladené podle jednotného dotazníku. Otázky se týkaly širokých témat jako škola, mládež, zaměstnání, rodina. **Otázky byly kladeny ve spisovném kódu (na rozdíl od PMK)** a nebyly nahrávány ani přepisovány (přepsány jsou pouze ojedinělé upřesňující vstupy explorátorů, označované jednotnou zkratkou T -- tazatel). Neformální promluvy tvoří dialogy dvou, případně i více mluvčích, kteří se dobře znají. Téma hovoru si volili sami. Jeden z účastníků dialogu byl zpravidla i respondentem ve formální promluvě, což umožňuje sledovat rozdíly češtiny užité v neoficiálních a polooficiálních situacích. V řadě případů byly nahrávky neformálních promluv pořízeny skrytým mikrofonem (jejich zveřejnění bylo mluvčími schváleno dodatečně), takže zaručují velkou míru autenticity a spontánnosti užitého jazyka.
  
-==== Gramatické značkování BMK ====+==== Značkování BMK ====
  
-V současné době probíhá na Fakultě informatiky MU a na Filozofické fakultě MU v Brně gramatické značkování BMK. Využívána je metoda poloautomatické analýzy, práci však komplikuje velká hlásková, tvarová i lexikální variabilita brněnské mluvy (prolínání dialektických, interdialektických, obecněčeských i spisovných podob). V ČNK lze proto s BMK pracovat zatím pouze jako s čistými texty, tj. především vyhledávat zadané konkordance s určitým tvarem nebo kombinací tvarů slova.+Na Fakultě informatiky MU a na Filozofické fakultě MU v Brně proběhlo zkušební morfologické  značkování BMK (viz např. Hlaváčková, D.: Korpus mluvené češtiny z brněnského prostředí a jeho morfologické značkování. SaS, 62, 2001, s. 62--70). Využívala se metoda poloautomatické analýzy, práci však komplikovala velká hlásková, tvarová i lexikální variabilita brněnské mluvy (prolínání dialektických, interdialektických, obecněčeských i spisovných podob). V ČNK lze proto s BMK pracovat zatím pouze jako s čistými texty, tj. především vyhledávat zadané konkordance s určitým tvarem nebo kombinací tvarů slova: **prozatím je BMK zpřístupněn bez morfologických značek.** 
 + 
 +==== Poděkování ==== 
 + 
 +Na tvorbě  BMK se v různých proporcích  podíleli: Zdeňka Hladká, Dana Hlaváčková, Daniel Jedlička a Táňa Vykypělová z Filozofické fakulty Masarykovy univerzity v Brně; s pořizováním nahrávek pomáhala  řada studentů FF MU a FSS MU.
  
-Na Fakultě informatiky MU a na Filozofické fakultě MU v Brně proběhlo zkušební morfologické  značkování BMK (viz např. Hlaváčková, D.: Korpus mluvené češtiny z brněnského prostředí a jeho morfologické značkování. SaS, 62, 2001, s. 62-70). **V ČNK je však BMK prozatím uložen bez morfologických značek.** 
  
 ===== Jak citovat BMK ===== ===== Jak citovat BMK =====
-<WRAP round tip 30%> + 
-Hladká, Z.: BMK (Brněnský mluvený korpus): přepisy nahrávek brněnské mluvy z 90.let 20. století. Ústav Českého národního korpusu FF UK, Praha 2002. Dostupný z WWW: http://www.korpus.cz.+<WRAP round tip 70%> 
 +Hladká, Z.: //BMK (Brněnský mluvený korpus): přepisy nahrávek brněnské mluvy z 90.let 20. století//. Ústav Českého národního korpusu FF UK, Praha 2002. Dostupný z WWW: http://www.korpus.cz.
 </WRAP> </WRAP>
  
- 
-==== Poděkování ==== 
-Na tvorbě  BMK se v různých proporcích  podíleli: Zdeňka Hladká, Dana Hlaváčková, Daniel Jedlička a Táňa Vykypělová z Filozofické fakulty Masarykovy univerzity v Brně; s pořizováním nahrávek pomáhala  řada studentů FF MU a FSS MU. 
  
  --- //Zdeňka Hladká//, garant BMK  --- //Zdeňka Hladká//, garant BMK
 +
 +===== Související odkazy =====
 +
 +<WRAP round box 49%>
 +[[ORAL2006]] • [[ORAL2008]] • [[ORAL2013]] • [[PMK]] • [[SCHOLA2010]] • [[pojmy:mluveny|Korpus mluveného jazyka]]
 + </WRAP>