Sběr nahrávek vyučovacích hodin
Pořizování nahrávek vyučovacích hodin probíhalo v letech 2005–2008. Na získávání sond se podíleli především pedagogové. Učitelé nám velmi pomohli se zpracováním nahrávek vyučovacích hodin, zejména s identifikací jednotlivých mluvčích.
Přepisování nahrávek vyučovacích hodin a kontroly hotových přepisů v jednotlivých fázích zpracování prováděli většinou studenti českého jazyka z FF a z PedF Univerzity Karlovy v Praze.
Zásady pro přepis vyučovacích hodin
Pravidla pro přepis nahrávek vyučovacích hodin byla sestavena na základě zásad, které původně vznikly pro mluvený korpus ORAL2006 (připravil je PhDr. Pavel Jančák, CSc.). Tyto zásady však musely být pro korpus SCHOLA2010 upraveny. Nahrávání se podařilo rozšířit i na východní území České republiky, bylo tedy nutné zaznamenávat i nářeční prvky z moravského, popřípadě slezského regionu.
Zvukové záznamy vyučovacích hodin nejsou přepsány fonetickou ani dialektologickou transkripcí, ale přepis slov se blíží běžnému ortografickému zápisu. Je ovšem modifikován tak, aby mohly být zachyceny rysy mluveného jazyka a regionální prvky. Tento způsob zpracování nahrávek vyučovacích hodin byl zvolen také proto, aby mohly přepisy vyučovacích hodin sloužit k didaktickým účelům.
Větná interpunkce je v přepisech vyučovacích hodin řešena tak, jak je to obvyklé v psaných textech, tj. je zapisována ve shodě s pravopisnými pravidly. Nezachycujeme přerušování výpovědi pauzami. Na začátku věty či souvětí je vždy malé písmeno.
Zvláštní rysy syntaktické stránky mluvených projevů (opakování slov, přiřazování vět a větných úseků apod.) jsou zachyceny zjednodušeně, většinou pouze pomocí interpunkčních znamének, zvláště čárky. Neukončené věty se označují třemi tečkami s dvojtečkou odsazenými mezerou. Pokud je mluvčí přerušen jiným mluvčím, ale ve výpovědi později pokračuje, je tento případ v dialogu označen třemi tečkami, a to jak na konci přerušené výpovědi, tak i na začátku její navazující části. Případy, kdy dva mluvčí hovořili současně a jde o různé výpovědi, jsou přepsány jako dva po sobě jdoucí dialogy.
Délku vokálů jsme se snažili zaznamenávat podle skutečné výslovnosti, např. řikat, zitra, vubec. Krácení je poměrně frekventované v sondách z východomoravské nářeční oblasti, kde délka často kolísá, např. vyborně/výborně. Polodlouhé vokály jsou označovány buď jako dlouhé, nebo jako krátké podle toho, k čemu mají nejblíže. Registrujeme i odlišnou kvantitu danou emfází, např. jéé, nó, nemóže aj.
Původní dlouhé ú (zachycené v sondách z východomoravské nářeční oblasti) je zapisováno podle pravidel běžných v dialektologii, např. sú, majú, se svojú aj. Ostatní případy přepisu u + kvantita zapisujeme shodně se spisovnou normou, např. dům, svůj, území aj.
Hlásky y–i jsou zapisovány ve shodě s pravopisnými pravidly, nikoliv podle výslovnosti (v sondách z východomoravské nářeční oblasti by bylo možné zaznamenat i výslovnost [y/ý], např. býk, výborně aj.).
Také skupiny dě, tě, ně, bě, pě, mě, vě obsahující podle pravopisných pravidel písmeno ě zaznamenáváme shodně s kodifikací, např. děti, město, věřit. Jsou zde zachyceny i případy mor. mět, chtět apod.
Protetické v- je zapisováno ve shodě s reálnou výslovností, např. von, vopravdu, vobránce aj.
Výslovnost měkkého ľ a tvrdého ł jsme nezaznamenávali, přestože v sondách z východomoravské nářeční oblasti by bylo možné narazit i na tyto případy výslovnosti.
Asimilace znělosti je většinou zapisována ve shodě s pravopisem. Zachyceny jsou jen případy typické regionálně příznakové výslovnosti, např. abyzme, byzme, zme, zhodné, zešit aj. Nezaznamenáváme případy mezislovní asimilace (přestože i tady může jít o regionální výslovnost, např. z maminkou apod.). Případy vyskytující se v korpusu SCHOLA2010 jsou uvedeny v databance Akces (ÚČJTK UK FF) – v „seznamu nalezených variant“ a „seznamu podle poslechu zkontrolovaných variant“.
Zdvojené souhlásky jsou zapisovány ve shodě s pravopisnými pravidly.
Případy artikulační asimilace a zjednodušování souhláskových skupin jsou zapsány pokud možno tak, jak byly vysloveny. Zachyceny jsou především ustálené výslovnostní varianty: čtyřka–štyřka–čtyrka––štyrka; dcera–cera–céra; jdu–du; jestli–jesli–jesi–esli, ještě–eště; jinší–inší; jméno–méno; jsme–sme–zme; kdepak–depak; kdyby–dyby; kratší–kračí; který–kerý; kterej–kerej; kvůli–kvuli–kuli; lepší–lepčí; nějaký–nejaký–ňáký; pani učitelko–pančitelko–paničelko–pančelko; prázdniny–prázniny; protože–prože–prže; příjdeš–přídeš; vlastně–vlasně; však–šak; výjde–vyjde–výde; vždycky–dycky; zvláštní–zvlášní ad. Varianty vyskytující se v korpusu SCHOLA2010 jsou uvedeny v databance Akces (ÚČJTK UK FF) – v „seznamu nalezených variant“ a „seznamu podle poslechu zkontrolovaných variant“.
Cizí vlastní a obecná jména se píší původním pravopisem. V případech, kdy výslovnost kolísá, u méně obvyklých jmen apod., zachycujeme reálnou výslovnost v hranatých závorkách (může jít i o individuální výslovnost), např. Hugo [igo], [hugo]; scanner [skenr], [skener]; cache [cache], [keš], [keše]. Výslovnost zdomácnělých slov cizího původu je zachycena přímo v textu.
Zkratky jsou zapsány tak, jak byly vysloveny, např. cé dé, případně zkratkovým slovem cédéčko. Kromě toho uvádíme jako komentář ve složených závorkách zápis zkratky podle běžných zvyklostí. K tomuto řešení nás přivedla nedostatečná srozumitelnost zkratky (v některých případech), např. á bé es {systém brzd ABS}, a také polysémie zkratek. Forma zápisu zkratky se řídí podle toho, zda byla zkratka vyslovena dohromady jako jedno slovo, např. dývídý, nebo byly jednotlivé hlásky vysloveny zvlášť, např. v š e. Pouze u zkratek, které se vyslovují pravidelně tak, jak se píší, ponecháváme tradiční podobu zápisu, např. NATO.
Jednotlivá písmena abecedy, proměnné a neznámé přepisujeme podle skutečné výslovnosti, např. a: á, b: bé, c: cé; x: iks, y: ypsilon ad. Podobně postupujeme při přepisu ostatních veličin a vzorců užitých např. v hodinách matematiky, fyziky a chemie. Zaznamenáváme je tak, aby bylo možno rekonstruovat výslovnost.
Seznam použitého označování:
. | konec věty,promluvy |
---|---|
, | vybočení ze syntaxe (další interpunkce běžně) |
…: | označení neukončené věty |
… | označení přerušené výpovědi |
— | úsek, který se nepodařilo rozluštit |
* | nedořečené slovo |
hmm | označení souhláskových zvuků |
eee | označení samohláskových zvuků |
Závorky:
( )
různé typy komentářů:
a) k situaci ve třídě, ke zvukům ve třídě, přerušení promluvy smíchem, k
mluvčím ad.; (hluk, křik), (kašlání), (nesouhlas), (smích), (diktuje), (kreslí na tabuli) aj.
b) komentáře vztahující se k vyučovacímu předmětu, k tématu, vysvětlující komentáře: začátek
činnosti, konec činnosti, citace, příklady nebo část příkladů ad.; (učitelka hraje na klavír), (zpěv), (začátek citace), (konec citace), (1+3=4), (AB>CD) aj. Pozn. 1: Zápis některých složitějších příkladů (obsahují specifické symboly, písmena řecké abecedy, zlomky, indexy aj.) nebylo možné kvůli prohlížeči Bonito do korpusu konvertovat, proto bylo toto místo v přepisu pro korpus nahrazeno komentářem - např.: (matematický příklad), (vzorec) aj. V databance Akces je k dispozici přepis v původním znění i s celým příkladem zachyceným v závorce.
{ }
v tomto typu závorek jsou zaznamenány zkratky, značky, symboly, veličiny, popřípadě i vysvětlující
komentář ke zkratkám či symbolům, zkratky ke zkratkovým slovům ad.; {operační systém Mac OS X}, {magnetická indukce B}, {helium He}, {CD disk} aj. Pozn. 2: Viz poznámka 1 – vyřešeno stejným způsobem, např.: {veličina}, {jednotka}, {chemická značka} aj.
[ ]
výslovnost cizích vlastních jmen (u méně obvyklých jmen; v případech, kdy výslovnost kolísá; někdy jsou
vyslovována cizí jména podle psané podoby ad.), cizích obecných jmen (pojmy; slovní spojení; krátké cizojazyčné úseky
ad.); [francoá vijón], [fransoá vijón], [fransoa vijón]; [bít dženerejšn], [beat generatijon]; [trast], [trust] aj.
Kódování:
NP | příjmení (křestní jména žáků nejsou kódována) |
---|---|
NT | název třídy |
NM | název místa |
– Hana Goláňová