Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010 [2014/03/26 15:55] – jankocek | cnk:sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010 [2015/05/11 13:55] – zuzanakomrskova |
---|
//**Hana Goláňová**// | //**Hana Goláňová**// |
| |
V korpusu SCHOLA2010 se nacházejí specifické **sociolingvistické charakteristiky nevyskytující se v ostatních mluvených korpusech**: informace o sondě (navíc -- region, místo pořízení sondy, velikost sídla), o škole, o třídě, o vyučovacím předmětu, o vyučovací hodině a doplňující údaje o mluvčím (jedinečný kód mluvčího; věkové skupiny platné pro učitele, cizí dospělé osoby, žáky a cizí žáky; aprobace pro učitele a cizí dospělé osoby; profese u cizí dospělé osoby; zvláštní poznámky pro žáka a cizího žáka; pobyt mluvčích v dětství -- stát; současná nářeční oblast pobytu mluvčího; údaje o médiu).\\ Mluvčím v tomto korpusu může být: učitel, žák, cizí dospělá osoba, cizí žák, společně mluvící osoby, třída v roli mluvčího, médium v roli mluvčího a komentář, který se octl v pozici mluvčího (např. smích).\\ Sociolingvistické charakteristiky uváděné v korpusu SCHOLA2010 byly konzultovány se sociologem PhDr. Ondřejem Hubáčkem. | V korpusu SCHOLA2010 se nacházejí specifické **sociolingvistické charakteristiky nevyskytující se v ostatních mluvených korpusech**: informace o sondě (navíc -- region, místo pořízení sondy, velikost sídla), o škole, o třídě, o vyučovacím předmětu, o vyučovací hodině a doplňující údaje o mluvčím (jedinečný kód mluvčího; věkové skupiny platné pro učitele, cizí dospělé osoby, žáky a cizí žáky; aprobace pro učitele a cizí dospělé osoby; profese u cizí dospělé osoby; zvláštní poznámky pro žáka a cizího žáka; pobyt mluvčích v dětství -- stát; současná nářeční oblast pobytu mluvčího; údaje o médiu). |
| |
Na základě sociolingvistických značek je možné si v korpusu SCHOLA2010 vytvořit i menší subkorpusy, viz [[schola_vyhledavani_a_subkorpusy|Vyhledávání v korpusu SCHOLA2010 a vytváření subkorpusů]].\\ \\ Ve vyhledávacím programu Bonito si můžeme repliky mezi jednotlivými mluvčími zobrazit následujícím způsobem: menu **Zobrazení/Struktury/sp**. | Mluvčím v tomto korpusu může být: učitel, žák, cizí dospělá osoba, cizí žák, společně mluvící osoby, třída v roli mluvčího, médium v roli mluvčího a komentář, který se octl v pozici mluvčího (např. smích). Sociolingvistické charakteristiky uváděné v korpusu SCHOLA2010 byly konzultovány se sociologem PhDr. Ondřejem Hubáčkem. |
| |
| Na základě sociolingvistických značek je možné si v korpusu SCHOLA2010 vytvořit i menší subkorpusy, viz [[schola_vyhledavani_a_subkorpusy|Vyhledávání v korpusu SCHOLA2010 a vytváření subkorpusů]]. |
| |
Zobrazení hodnot sociolingvistických charakteristik u jednotlivých slovních výskytů v korpusu SCHOLA2010 můžeme provést: | Zobrazení hodnot sociolingvistických charakteristik u jednotlivých slovních výskytů v korpusu SCHOLA2010 můžeme provést u přístupu do korpusu přes webové rozhraní [[https://www.korpus.cz/kontext|KonText]] kliknutím na název sondy vlevo. |
| |
- v prohlížeči Bonito kliknutím pravým tlačítkem počítačové myši, | ^**ZNAČKA **^**POPIS**| |
- u přístupu do korpusu přes [[https://www.korpus.cz/kontext|webové rozhraní]] kliknutím na název sondy vlevo.//\\ // | ^**DOKUMENT/ SONDA**| | |
| |
|**ZNAČKA **|**POPIS**| | |
|**DOKUMENT/\\ SONDA**| | | |
|**doc.id**|**Kód sondy.** Např. N001-S01-U01-T001; první část kódu vyjadřuje označení sondy, druhá část za pomlčkou je značka pro školu, pak následuje značka pro učitele, poslední část kódu je označení pro třídu.| | |**doc.id**|**Kód sondy.** Např. N001-S01-U01-T001; první část kódu vyjadřuje označení sondy, druhá část za pomlčkou je značka pro školu, pak následuje značka pro učitele, poslední část kódu je označení pro třídu.| |
|**doc.temp**|**Rok pořízení sondy.** Může nabývat hodnot: __2005--2008__.| | |**doc.temp**|**Rok pořízení sondy.** Může nabývat hodnot: ''2005--2008''.| |
|**doc.pocetml**|**Celkový počet mluvčích v sondě.** Do sumy je zahrnuta také třída v roli mluvčího i médium v roli mluvčího, pokud se v sondě tyto typy mluvčích vyskytují.| | |**doc.pocetml**|**Celkový počet mluvčích v sondě.** Do sumy je zahrnuta také třída v roli mluvčího i médium v roli mluvčího, pokud se v sondě tyto typy mluvčích vyskytují.| |
|**doc.promluva**|**Typ promluvy**. U všech sond se vyskytuje kategorie __F__ -- formální promluva (u typu promluvy jsme si vědomi poměrně velkého zjednodušení, důvody jsou vysvětleny v úvodním textu).| | |**doc.promluva**|**Typ promluvy**. U všech sond se vyskytuje kategorie ''F'' -- formální promluva (u typu promluvy jsme si vědomi poměrně velkého zjednodušení, důvody jsou vysvětleny v úvodním textu).| |
|**doc.region**|**Název regionu**, v němž byla sonda pořízena. Původní nabídka hodnot: __Čechy__; __Morava__; __Slezsko__. Sondy ze Slezska se do výzkumu zařadit nepodařilo.| | |**doc.region**|**Název regionu**, v němž byla sonda pořízena. Původní nabídka hodnot: ''Čechy''; ''Morava''; ''Slezsko''. Sondy ze Slezska se do výzkumu zařadit nepodařilo.| |
|**doc.oblast**|**Název nářeční oblasti**, v níž byla sonda nahrána. Původní nabídka hodnot: __středočeská__; __severovýchodočeská__; __jihozápadočeská__; __česko--moravská__; __pohraničí české__; __pohraničí moravské__; __středomoravská__; __východomoravská__; __slezská__. Vymezení nářečních oblastí se opírá o pojetí Běličovo, //Nástin české dialektologie//, 1972, a o členění nářečních oblastí v //Českém jazykovém atlasu//, 1992--2005. Sondy z těchto oblastí se do výzkumu zařadit nepodařilo: severovýchodočeská, česko--moravská, pohraničí moravské, středomoravská, slezská.\\ | | |**doc.oblast**|**Název nářeční oblasti**, v níž byla sonda nahrána. Původní nabídka hodnot: ''středočeská''; ''severovýchodočeská''; ''jihozápadočeská''; ''česko--moravská''; ''pohraničí české''; ''pohraničí moravské''; ''středomoravská''; ''východomoravská''; ''slezská''. Vymezení nářečních oblastí se opírá o pojetí Běličovo, //Nástin české dialektologie//, 1972, a o členění nářečních oblastí v //Českém jazykovém atlasu//, 1992--2005. Sondy z těchto oblastí se do výzkumu zařadit nepodařilo: severovýchodočeská, česko--moravská, pohraničí moravské, středomoravská, slezská.\\ | |
|**doc.misto**|**Místo pořízení sondy**. Může nabývat hodnot: __Praha__; __mimopražská sonda__.| | |**doc.misto**|**Místo pořízení sondy**. Může nabývat hodnot: ''Praha''; ''mimopražská sonda''.| |
|**doc.sidlo**|**Velikost sídla**, v němž byla sonda nahrána. Může nabývat hodnot: __nad 100 tis.__; __nad 50 tis.__; __nad 10 tis.__; __nad 5 tis.__; __méně než 5 tis.__| | |**doc.sidlo**|**Velikost sídla**, v němž byla sonda nahrána. Může nabývat hodnot: ''nad 100 tis.''; ''nad 50 tis.''; ''nad 10 tis.''; ''nad 5 tis.''; ''méně než 5 tis.''| |
|**ŠKOLA**| | | ^**ŠKOLA**| | |
|**sk.typ1**|**Typ školy podle instituce**. Může nabývat hodnot: __ZŠ__; __G__; __G víceleté__; __SOŠ__. Ostatní typy škol se do výzkumu nepodařilo zařadit.| | |**sk.typ1**|**Typ školy podle instituce**. Může nabývat hodnot: ''ZŠ''; ''G''; ''G víceleté''; ''SOŠ''. Ostatní typy škol se do výzkumu nepodařilo zařadit.| |
|**sk.typ2**|**Typ školy podle zřizovatele**. Může nabývat hodnot: __státní škola__; __soukromá škola__; __církevní škola__.| | |**sk.typ2**|**Typ školy podle zřizovatele**. Může nabývat hodnot: ''státní škola''; ''soukromá škola''; ''církevní škola''.| |
|**sk.typ3**|**Typ školy sociologicky**. Může nabývat hodnot: __tradiční městská zástavba__; __sídlištní škola__, __venkovská škola__.| | |**sk.typ3**|**Typ školy sociologicky**. Může nabývat hodnot: ''tradiční městská zástavba''; ''sídlištní škola'', ''venkovská škola''.| |
|**sk.gvicelete**|**Víceleté gymnázium**. Tato kategorie je vyplněna pouze u víceletých gymnázií. Může nabývat hodnot: __šestileté__ a __osmileté__. Sedmileté gymnázium se do výzkumu zařadit nepodařilo.| | |**sk.gvicelete**|**Víceleté gymnázium**. Tato kategorie je vyplněna pouze u víceletých gymnázií. Může nabývat hodnot: ''šestileté'' a ''osmileté''. Sedmileté gymnázium se do výzkumu zařadit nepodařilo.| |
|**TŘÍDA**| | | ^**TŘÍDA**| | |
|**tr.trida**|**Třída ZŠ nebo odpovídající třída víceletého gymnázia**. Může nabývat hodnot: __1--9__. (kromě 4. třídy). V ostatních případech tato kategorie zůstává nevyplněná.| | |**tr.trida**|**Třída ZŠ nebo odpovídající třída víceletého gymnázia**. Může nabývat hodnot: ''1--9''. (kromě 4. třídy). V ostatních případech tato kategorie zůstává nevyplněná.| |
|**tr.rocnik**|**Ročník SŠ, gymnázia nebo odpovídající ročník víceletého gymnázia**. Může nabývat hodnot: __1--5__. Sondy z 5. ročníku (vyskytuje se u některých typů SOŠ) se do výzkumu zařadit nepodařilo. V ostatních případech tato kategorie zůstává nevyplněná.| | |**tr.rocnik**|**Ročník SŠ, gymnázia nebo odpovídající ročník víceletého gymnázia**. Může nabývat hodnot: ''1--5''. Sondy z 5. ročníku (vyskytuje se u některých typů SOŠ) se do výzkumu zařadit nepodařilo. V ostatních případech tato kategorie zůstává nevyplněná.| |
|**tr.gvicelete**|**Třída víceletého gymnázia**. Může nabývat hodnot: __prima__; __sekunda__; __tercie__; __kvarta__; __kvinta__; __sexta__; __septima__; __oktáva__. V ostatních případech tato kategorie zůstává nevyplněná.| | |**tr.gvicelete**|**Třída víceletého gymnázia**. Může nabývat hodnot: ''prima''; ''sekunda''; ''tercie''; ''kvarta''; ''kvinta''; ''sexta''; ''septima''; ''oktáva''. V ostatních případech tato kategorie zůstává nevyplněná.| |
|**tr.typ**|**Typ třídy**. Může nabývat hodnot: __standardní třída__ (1 třída = jeden postupný ročník); __smíšená třída__ (1 třída = žáci z více postupných ročníků ZŠ); __sloučená třída__ (1 třída = žáci z několika tříd jednoho ročníku, většinou semináře na G).| | |**tr.typ**|**Typ třídy**. Může nabývat hodnot: ''standardní třída'' (1 třída = jeden postupný ročník); ''smíšená třída'' (1 třída = žáci z více postupných ročníků ZŠ); ''sloučená třída'' (1 třída = žáci z několika tříd jednoho ročníku, většinou semináře na G).| |
|**tr.pocet_z**|**Počet žáků ve třídě**. Může nabývat hodnot: __do 20 žáků__; __nad 20 žáků__.| | |**tr.pocet_z**|**Počet žáků ve třídě**. Může nabývat hodnot: ''do 20 žáků''; ''nad 20 žáků''.| |
|**PŘEDMĚT**| | | ^**PŘEDMĚT**| | |
|**pr.predmet**|**Zkratka vyučovacího předmětu**. Může nabývat hodnot: __Čjl__; __Ma__; __Fy__; __Che__; __Př/Bi__ -- přírodopis, biologie; __Ze/Ge__ -- zeměpis, geografie; __Dě/Hi__ -- dějepis, historie; __Ov/Zsv__ -- občanská výchova, základy společenských věd; __Esv__ -- estetická výchova; __Hv__; __Vv__; __Nv/Kv__ -- náboženství, křesťanská výchova; __Vl__ -- vlastivěda; __Prv__ -- prvouka; __Pč__ -- pracovní činnosti; __Inf__ -- informatika; __odborný__ (předmět); dále ojediněle předmět „__humanitní základ__“; Rv -- rodinnou výchovu se nám do výzkumu nepodařilo zařadit. Zkratky vyučovacích předmětů jsou lematizovány, ve skutečnosti se mohou názvy vyučovacích předmětů od zkratek lišit.| | |**pr.predmet**|**Zkratka vyučovacího předmětu**. Může nabývat hodnot: __Čjl__; __Ma__; __Fy__; __Che__; __Př/Bi__ -- přírodopis, biologie; __Ze/Ge__ -- zeměpis, geografie; __Dě/Hi__ -- dějepis, historie; __Ov/Zsv__ -- občanská výchova, základy společenských věd; __Esv__ -- estetická výchova; __Hv__; __Vv__; __Nv/Kv__ -- náboženství, křesťanská výchova; __Vl__ -- vlastivěda; __Prv__ -- prvouka; __Pč__ -- pracovní činnosti; __Inf__ -- informatika; __odborný__ (předmět); dále ojediněle předmět „__humanitní základ__“; Rv -- rodinnou výchovu se nám do výzkumu nepodařilo zařadit. Zkratky vyučovacích předmětů jsou lematizovány, ve skutečnosti se mohou názvy vyučovacích předmětů od zkratek lišit.| |
|**pr.predmskup**|**Zařazení do skupiny vyučovacích předmětů**. Může nabývat hodnot: __český jazyk a literatura__; __matematický a přírodovědný blok__; __společenskovědní a výchovný blok__; __informační, technický a profesní blok__.| | |**pr.predmskup**|**Zařazení do skupiny vyučovacích předmětů**. Může nabývat hodnot: __český jazyk a literatura__; __matematický a přírodovědný blok__; __společenskovědní a výchovný blok__; __informační, technický a profesní blok__.| |
|**pr.cjl**|**Český jazyk a literatura**. Platné pouze pro uvedený předmět, v ostatních případech zůstává tato kategorie nevyplněná. Může nabývat hodnot: __převážně jazyková hodina__; __převážně slohově-komunikační hodina__; __převážně literární hodina__.| | |**pr.cjl**|**Český jazyk a literatura**. Platné pouze pro uvedený předmět, v ostatních případech zůstává tato kategorie nevyplněná. Může nabývat hodnot: __převážně jazyková hodina__; __převážně slohově-komunikační hodina__; __převážně literární hodina__.| |
|**pr.typ**|**Typ vyučovacího předmětu**. Může nabývat hodnot: __povinný předmět__; __volitelný předmět__; __nepovinný předmět__.| | |**pr.typ**|**Typ vyučovacího předmětu**. Může nabývat hodnot: __povinný předmět__; __volitelný předmět__; __nepovinný předmět__.| |
|**VYUČ. HODINA**| | | ^**VYUČ. HODINA**| | |
|**vh.tema**|**Téma vyučovací hodiny**. Nabývá různých hodnot podle toho, jak tuto kategorii zaznamenali učitelé.| | |**vh.tema**|**Téma vyučovací hodiny**. Nabývá různých hodnot podle toho, jak tuto kategorii zaznamenali učitelé.| |
|**vh.poradirozvrh**|**Pořadí vyučovací hodiny v rozvrhu hodin**. Může nabývat hodnot: __1.--8. hodina__. Vyučovací hodiny mající jiné pořadí v rozvrhu hodin se do výzkumu zařadit nepodařilo.| | |**vh.poradirozvrh**|**Pořadí vyučovací hodiny v rozvrhu hodin**. Může nabývat hodnot: __1.--8. hodina__. Vyučovací hodiny mající jiné pořadí v rozvrhu hodin se do výzkumu zařadit nepodařilo.| |
|**vh.typfunkce**|**Typ vyučovací hodiny -- podle funkce**. Může nabývat hodnot: __převážně výkladová hodina__; __procvičovací hodina__ -- procvičuje se učivo z minulých v. hodin; __opakovací hodina__ -- opakuje se např. čtvrtletní, pololetní učivo; __prověřovací hodina__ -- převážně se zkouší nebo se píše písemná práce; __smíšená hodina__; __jiná hodina__ -- referáty, práce s texty aj.| | |**vh.typfunkce**|**Typ vyučovací hodiny -- podle funkce**. Může nabývat hodnot: __převážně výkladová hodina__; __procvičovací hodina__ -- procvičuje se učivo z minulých v. hodin; __opakovací hodina__ -- opakuje se např. čtvrtletní, pololetní učivo; __prověřovací hodina__ -- převážně se zkouší nebo se píše písemná práce; __smíšená hodina__; __jiná hodina__ -- referáty, práce s texty aj.| |
|**vh.misto**|**Místo vyučovací hodiny**. Může nabývat hodnot: __ve třídě__; __venku__; __jinde__ -- speciální učebny, školní knihovna apod.| | |**vh.misto**|**Místo vyučovací hodiny**. Může nabývat hodnot: __ve třídě__; __venku__; __jinde__ -- speciální učebny, školní knihovna apod.| |
|**MLUVČÍ**| | | ^**MLUVČÍ**| | |
|**sp.num**|**Kód mluvčího**. Určitému typu mluvčího odpovídá i typ kódu:\\ **učitel** - např. U01 (kód je obsažen v celkovém kódu nahrávky), do této kategorie mluvčích jsou zahrnuti učitelé i učitelky;\\ **žák** - např. Z01, do této kategorie mluvčích jsou zahrnuti žáci i žákyně;\\ **cizí dospělá osoba** - např. CD01 (učitel/učitelka z jiné třídy, sekretářka aj.);\\ **cizí žák** - např. CZ01 (žák/žákyně z jiné třídy);\\ **společně mluvící mluvčí** - např. U01, Z01 nebo Z01, Z02 nebo U01, T001 aj.;\\ **třída v roli mluvčího** - např. T001 (kód je obsažen v celkovém kódu nahrávky);\\ **médium v roli mluvčího** - např. M01;\\ **komentář**, který se octl v pozici mluvčího, má vždy stejný a jednotný kód -- K (např. smích).\\ V případě společně mluvících mluvčích, třídy v roli mluvčího, média, komentáře v pozici mluvčího nejsou vyplněny sociolingvistické charakteristiky, které pak následují: sp.pohlavi až sp.soucasnaoblast.| | |**sp.num**|**Kód mluvčího**. Určitému typu mluvčího odpovídá i typ kódu:\\ **učitel** - např. U01 (kód je obsažen v celkovém kódu nahrávky), do této kategorie mluvčích jsou zahrnuti učitelé i učitelky;\\ **žák** - např. Z01, do této kategorie mluvčích jsou zahrnuti žáci i žákyně;\\ **cizí dospělá osoba** - např. CD01 (učitel/učitelka z jiné třídy, sekretářka aj.);\\ **cizí žák** - např. CZ01 (žák/žákyně z jiné třídy);\\ **společně mluvící mluvčí** - např. U01, Z01 nebo Z01, Z02 nebo U01, T001 aj.;\\ **třída v roli mluvčího** - např. T001 (kód je obsažen v celkovém kódu nahrávky);\\ **médium v roli mluvčího** - např. M01;\\ **komentář**, který se octl v pozici mluvčího, má vždy stejný a jednotný kód -- K (např. smích).\\ V případě společně mluvících mluvčích, třídy v roli mluvčího, média, komentáře v pozici mluvčího nejsou vyplněny sociolingvistické charakteristiky, které pak následují: sp.pohlavi až sp.soucasnaoblast.| |
|**sp.inum**|**Jedinečný kód mluvčího**. Je vyplněn pouze u mluvčích, které lze označit jako osoby: učitel, žák, cizí dospělá osoba, cizí žák.| | |**sp.inum**|**Jedinečný kód mluvčího**. Je vyplněn pouze u mluvčích, které lze označit jako osoby: učitel, žák, cizí dospělá osoba, cizí žák.| |