Toto je starší verze dokumentu!
Sociolingvistické značky a charakteristiky v korpusu SCHOLA2010
Hana Goláňová
V korpusu SCHOLA2010 se nacházejí specifické sociolingvistické charakteristiky nevyskytující se v ostatních mluvených korpusech: informace o sondě (navíc – region, místo pořízení sondy, velikost sídla), o škole, o třídě, o vyučovacím předmětu, o vyučovací hodině a doplňující údaje o mluvčím (jedinečný kód mluvčího; věkové skupiny platné pro učitele, cizí dospělé osoby, žáky a cizí žáky; aprobace pro učitele a cizí dospělé osoby; profese u cizí dospělé osoby; zvláštní poznámky pro žáka a cizího žáka; pobyt mluvčích v dětství – stát; současná nářeční oblast pobytu mluvčího; údaje o médiu).
Mluvčím v tomto korpusu může být: učitel, žák, cizí dospělá osoba, cizí žák, společně mluvící osoby, třída v roli mluvčího, médium v roli mluvčího a komentář, který se octl v pozici mluvčího (např. smích).
Sociolingvistické charakteristiky uváděné v korpusu SCHOLA2010 byly konzultovány se sociologem PhDr. Ondřejem Hubáčkem.
Na základě sociolingvistických značek je možné si v korpusu SCHOLA2010 vytvořit i menší subkorpusy, viz Vyhledávání v korpusu SCHOLA2010 a vytváření subkorpusů.
Ve vyhledávacím programu Bonito si můžeme repliky mezi jednotlivými mluvčími zobrazit následujícím způsobem: menu Zobrazení/Struktury/sp.
Zobrazení hodnot sociolingvistických charakteristik u jednotlivých slovních výskytů v korpusu SCHOLA2010 můžeme provést:
- v prohlížeči Bonito kliknutím pravým tlačítkem počítačové myši,
- u přístupu do korpusu přes webové rozhraní kliknutím na název sondy vlevo.
ZNAČKA | POPIS |
---|---|
DOKUMENT/ SONDA | |
doc.id | Kód sondy. Např. N001-S01-U01-T001; první část kódu vyjadřuje označení sondy, druhá část za pomlčkou je značka pro školu, pak následuje značka pro učitele, poslední část kódu je označení pro třídu. |
doc.temp | Rok pořízení sondy. Může nabývat hodnot: 2005–2008. |
doc.pocetml | Celkový počet mluvčích v sondě. Do sumy je zahrnuta také třída v roli mluvčího i médium v roli mluvčího, pokud se v sondě tyto typy mluvčích vyskytují. |
doc.promluva | Typ promluvy. U všech sond se vyskytuje kategorie F – formální promluva (u typu promluvy jsme si vědomi poměrně velkého zjednodušení, důvody jsou vysvětleny v úvodním textu). |
doc.region | Název regionu, v němž byla sonda pořízena. Původní nabídka hodnot: Čechy; Morava; Slezsko. Sondy ze Slezska se do výzkumu zařadit nepodařilo. |
doc.oblast | Název nářeční oblasti, v níž byla sonda nahrána. Původní nabídka hodnot: středočeská; severovýchodočeská; jihozápadočeská; česko–moravská; pohraničí české; pohraničí moravské; středomoravská; východomoravská; slezská. Vymezení nářečních oblastí se opírá o pojetí Běličovo, Nástin české dialektologie, 1972, a o členění nářečních oblastí v Českém jazykovém atlasu, 1992–2005. Sondy z těchto oblastí se do výzkumu zařadit nepodařilo: severovýchodočeská, česko–moravská, pohraničí moravské, středomoravská, slezská. |
doc.misto | Místo pořízení sondy. Může nabývat hodnot: Praha; mimopražská sonda. |
doc.sidlo | Velikost sídla, v němž byla sonda nahrána. Může nabývat hodnot: nad 100 tis.; nad 50 tis.; nad 10 tis.; nad 5 tis.; méně než 5 tis. |
ŠKOLA | |
sk.typ1 | Typ školy podle instituce. Může nabývat hodnot: ZŠ; G; G víceleté; SOŠ. Ostatní typy škol se do výzkumu nepodařilo zařadit. |
sk.typ2 | Typ školy podle zřizovatele. Může nabývat hodnot: státní škola; soukromá škola; církevní škola. |
sk.typ3 | Typ školy sociologicky. Může nabývat hodnot: tradiční městská zástavba; sídlištní škola, venkovská škola. |
sk.gvicelete | Víceleté gymnázium. Tato kategorie je vyplněna pouze u víceletých gymnázií. Může nabývat hodnot: šestileté a osmileté. Sedmileté gymnázium se do výzkumu zařadit nepodařilo. |
TŘÍDA | |
tr.trida | Třída ZŠ nebo odpovídající třída víceletého gymnázia. Může nabývat hodnot: 1–9. (kromě 4. třídy). V ostatních případech tato kategorie zůstává nevyplněná. |
tr.rocnik | Ročník SŠ, gymnázia nebo odpovídající ročník víceletého gymnázia. Může nabývat hodnot: 1–5. Sondy z 5. ročníku (vyskytuje se u některých typů SOŠ) se do výzkumu zařadit nepodařilo. V ostatních případech tato kategorie zůstává nevyplněná. |
tr.gvicelete | Třída víceletého gymnázia. Může nabývat hodnot: prima; sekunda; tercie; kvarta; kvinta; sexta; septima; oktáva. V ostatních případech tato kategorie zůstává nevyplněná. |
tr.typ | Typ třídy. Může nabývat hodnot: standardní třída (1 třída = jeden postupný ročník); smíšená třída (1 třída = žáci z více postupných ročníků ZŠ); sloučená třída (1 třída = žáci z několika tříd jednoho ročníku, většinou semináře na G). |
tr.pocet_z | Počet žáků ve třídě. Může nabývat hodnot: do 20 žáků; nad 20 žáků. |
PŘEDMĚT | |
pr.predmet | Zkratka vyučovacího předmětu. Může nabývat hodnot: Čjl; Ma; Fy; Che; Př/Bi – přírodopis, biologie; Ze/Ge – zeměpis, geografie; Dě/Hi – dějepis, historie; Ov/Zsv – občanská výchova, základy společenských věd; Esv – estetická výchova; Hv; Vv; Nv/Kv – náboženství, křesťanská výchova; Vl – vlastivěda; Prv – prvouka; Pč – pracovní činnosti; Inf – informatika; odborný (předmět); dále ojediněle předmět „humanitní základ“; Rv – rodinnou výchovu se nám do výzkumu nepodařilo zařadit. Zkratky vyučovacích předmětů jsou lematizovány, ve skutečnosti se mohou názvy vyučovacích předmětů od zkratek lišit. |
pr.predmskup | Zařazení do skupiny vyučovacích předmětů. Může nabývat hodnot: český jazyk a literatura; matematický a přírodovědný blok; společenskovědní a výchovný blok; informační, technický a profesní blok. |
pr.cjl | Český jazyk a literatura. Platné pouze pro uvedený předmět, v ostatních případech zůstává tato kategorie nevyplněná. Může nabývat hodnot: převážně jazyková hodina; převážně slohově-komunikační hodina; převážně literární hodina. |
pr.typ | Typ vyučovacího předmětu. Může nabývat hodnot: povinný předmět; volitelný předmět; nepovinný předmět. |
VYUČ. HODINA | |
vh.tema | Téma vyučovací hodiny. Nabývá různých hodnot podle toho, jak tuto kategorii zaznamenali učitelé. |
vh.poradirozvrh | Pořadí vyučovací hodiny v rozvrhu hodin. Může nabývat hodnot: 1.–8. hodina. Vyučovací hodiny mající jiné pořadí v rozvrhu hodin se do výzkumu zařadit nepodařilo. |
vh.delka | Vyučovací hodina podle délky. Může nabývat hodnot: standardní h. (cca 45 min.); nebo dvouhodinovka (cca 90 min). |
vh.typdidakticky | Typ vyučovací hodiny – didakticky. Může nabývat hodnot: klasická hodina; jiná hodina – může se jednat např. o skupinovou práci apod. |
vh.typfunkce | Typ vyučovací hodiny – podle funkce. Může nabývat hodnot: převážně výkladová hodina; procvičovací hodina – procvičuje se učivo z minulých v. hodin; opakovací hodina – opakuje se např. čtvrtletní, pololetní učivo; prověřovací hodina – převážně se zkouší nebo se píše písemná práce; smíšená hodina; jiná hodina – referáty, práce s texty aj. |
vh.misto | Místo vyučovací hodiny. Může nabývat hodnot: ve třídě; venku; jinde – speciální učebny, školní knihovna apod. |
MLUVČÍ | |
sp.num | Kód mluvčího. Určitému typu mluvčího odpovídá i typ kódu: učitel - např. U01 (kód je obsažen v celkovém kódu nahrávky), do této kategorie mluvčích jsou zahrnuti učitelé i učitelky; žák - např. Z01, do této kategorie mluvčích jsou zahrnuti žáci i žákyně; cizí dospělá osoba - např. CD01 (učitel/učitelka z jiné třídy, sekretářka aj.); cizí žák - např. CZ01 (žák/žákyně z jiné třídy); společně mluvící mluvčí - např. U01, Z01 nebo Z01, Z02 nebo U01, T001 aj.; třída v roli mluvčího - např. T001 (kód je obsažen v celkovém kódu nahrávky); médium v roli mluvčího - např. M01; komentář, který se octl v pozici mluvčího, má vždy stejný a jednotný kód – K (např. smích). V případě společně mluvících mluvčích, třídy v roli mluvčího, média, komentáře v pozici mluvčího nejsou vyplněny sociolingvistické charakteristiky, které pak následují: sp.pohlavi až sp.soucasnaoblast. |
sp.inum | Jedinečný kód mluvčího. Je vyplněn pouze u mluvčích, které lze označit jako osoby: učitel, žák, cizí dospělá osoba, cizí žák. |
sp.osoba | Charakteristika mluvčího. Může nabývat hodnot: učitel; žák; cizí dospělá osoba; cizí žák. Tato kategorie je vyplněna pouze u mluvčích, které lze označit jako osoby. |
sp.pohlavi | Pohlaví mluvčího. Může nabývat hodnot: Z – žena; nebo M – muž. Tato kategorie je vyplněna pouze u těch mluvčích, u nichž je to relevantní. |
sp.veknum | Věk mluvčího v době pořízení sondy. U žáků může nabývat hodnot 6–23 let (např. 6); u učitele a cizí dospělé osoby 23–69 let (např. 23). Starší osoby se v korpusu nevyskytují. |
sp.vek | Věková kategorie užívaná v mluvených korpusech, např. PMK, BMK, ORAL2006 aj. Může nabývat hodnot: I – do 35 let, všichni žáci a cizí žáci; nebo V – nad 35 let. |
sp.vek_u | Věkové skupiny platné pro učitele a cizí dospělé osoby – po dekádách. Může nabývat hodnot: do 30 let; 31 - 40 let; 41 - 50 let; 51 - 60 let; nad 60 let. Tato kategorie je vyplněná pouze u učitele a cizí dospělé osby v roli mluvčího. |
sp.vek_z | Věkové skupiny platné pro žáky a cizí žáky. Může nabývat hodnot: do 11 let; 12 - 15 let; nad 15 let. Tato kategorie je vyplněná pouze u žáka a cizího žáka v roli mluvčího. |
sp.vzdelani | Vzdělání mluvčího I. (Jede o typ užívaný ve všech mluvených korpusech. Může nabývat hodnot: A – VŠ; nebo B –ZŠ, SŠ – všichni žáci a cizí žáci.) |
sp.vzdelanityp | Vzdělání mluvčího II. Jde o typ užívaný v mluvených korpusech ORAL. Může nabývat hodnot: ZŠ; SŠ; VŠ. Žáky jsme zařadili do ZŠ, nebo SŠ podle typu započatého studia. |
sp.aprobace_u | Aprobace učitele nebo cizí dospělé osoby. Nabídka hodnot vychází z charakteristiky – pr.predmet, … odborný předmět, navíc jsou zařazeny hodnoty: cizí jazyk; první stupeň, speciální (aprobace); žádná aprobace. Tato kategorie je vyplněná pouze u učitele, popřípadě u cizí dospělé osoby v roli mluvčího. |
sp.profese_cd | Profese u cizí dospělé osoby. Může nabývat hodnot: učitel,-ka; jiná (profese). Tato kategorie je vyplněná pouze u cizí dospělé osoby v roli mluvčího. |
sp.poznamky_z | Zvláštní poznámky u žáka a cizího žáka. Může nabývat hodnot: s poruchou učení; s poruchou chování; cizinec; jiné – zdravotní postižení a další komentáře. Tato kategorie nebyla vyplněná u všech žáků a cizích žáků. |
sp.pobytstat | Pobyt mluvčího v dětství – stát. Může nabývat hodnot: ČR; jiný (cizí stát). Tento údaj umožňuje vyhledat osoby, které žily v cizině nebo jsou cizinci – zejména žáky. Tato kategorie není vyplněna u všech žáků. |
sp.detstvioblast | Pobyt mluvčího v dětství – nářeční oblast. Nabídka hodnot je stejná jako u charakteristiky doc.oblast. Nářeční oblast pobytu mluvčího v dětství (cca do 15 let) se může lišit jednak od nářeční oblasti, kde byla sonda pořízena, a také od nářeční oblasti, kde v současné době mluvčí žije. U mluvčích nebylo zjištěno, že by v dětství pobývali v nářeční oblasti česko–moravské a v pohraničí moravském. Tato kategorie ale nebyla vyplněna u všech mluvčích. |
sp.soucasnaoblast | Současný pobyt mluvčího – nářeční oblast. Nabídka hodnot je stejná jako u charakteristiky doc.oblast. Nářeční oblast pobytu mluvčího se může lišit od oblasti, kde byla sonda pořízena. U mluvčích nebylo zjištěno, že by v současné době pobývali v nářeční oblasti česko–moravské a v pohraničí moravském. |
sp.medium | Typ média. Může nabývat hodnot: CD; školní rozhlas. Původní nabídka typů médií byla širší. Tato kategorie je vyplněna pouze u média v roli mluvčího. |