Toto je starší verze dokumentu!
Sociolingvistické a didaktické značky v korpusu SKRIPT2012
Hana Goláňová
V korpusu SKRIPT2012 se nacházejí sociolingvistické a didaktické charakteristiky, které byly vytvořeny na základě korpusu SCHOLA2010; jsou to informace o dokumentu, o škole, o třídě, o žáku a o učiteli, viz přehled značek uvedených níže v tabulce. Kromě toho korpus SKRIPT2012 zaznamenává také metadata specifická; jsou to údaje na úrovni textu, které se vztahují ke konkrétním školním pracím, viz přehled značek uvedených níže v tabulce.
V případech, kdy některá hodnota nebyla vyplněna vůbec, je v sociolingvistickém značení položka prázdná. Pokud je některý parametr v určitých případech nerelevantní (např. doc.tr_gvicelete), je položka proškrtnutá.
Na základě sociolingvistických a didaktických značek je možné si v korpusu SKRIPT2012 vytvořit menší subkorpusy, viz Vyhledávání v korpusu SKRIPT2012 a vytváření subkorpusů a Vyhledávání v korpusu SCHOLA2010 a vytváření subkorpusů.
Přes webové rozhraní KonText (kliknutím na název sondy vlevo) si můžeme v korpusu SKRIPT2012 u jednotlivých slovních výskytů zadaného dotazu zobrazit hodnoty sociolingvistických charakteristik.
ZNAČKA | POPIS |
---|---|
DOKUMENT/ SONDA | |
doc.id | Kód písemné práce. |
doc.temp | Rok původu písemné práce. |
doc.region | Název regionu, v němž byla sonda pořízena. Může nabývat hodnot: Čechy. Do výzkumu se nepodařilo zařadit texty z Moravy a ze Slezska. |
doc.oblast | Název nářeční oblasti, odkud práce pochází. Může nabývat hodnot: středočeská; jihozápadočeská; pohraničí české. Do výzkumu se nepodařilo zařadit texty ze severovýchodočeské nářeční oblasti, z česko–moravské, středomoravské, východomoravské, pohraničí moravského a slezské nářeční oblasti. Vymezení nářečních oblastí se opírá o pojetí Běličovo, Nástin české dialektologie, 1972, a o členění nářečních oblastí v Českém jazykovém atlasu, 1992–2005. |
doc.misto | Místo pořízení písemné práce. Může nabývat hodnot: Praha; mimopražská práce. |
doc.sidlo | Velikost sídla, v němž byla práce získána. Může nabývat hodnot: nad 100 tis.; nad 50 tis.; nad 10 tis.; nad 5 tis.; méně než 5 tis. |
ŠKOLA | |
doc.sk_typ1 | Typ školy podle instituce. Může nabývat hodnot: ZŠ; G; G víceleté; SOŠ. Ostatní typy škol se do výzkumu nepodařilo zařadit. |
doc.sk_typ2 | Typ školy podle zřizovatele. Může nabývat hodnot: státní; soukromá. Církevní školy se do výzkumu zařadit nepodařilo. |
doc.sk_gvicelete | Víceleté gymnázium. Tato kategorie je vyplněna pouze u víceletých gymnázií. Může nabývat hodnot: osmileté. Šestileté a sedmileté gymnázium se do výzkumu zařadit nepodařilo. |
TŘÍDA | |
doc.tr_trida | Třída ZŠ nebo odpovídající třída víceletého gymnázia. Může nabývat hodnot: 5.–9. V ostatních případech tato kategorie zůstává nevyplněná. |
doc.tr_rocnik | Ročník SŠ, gymnázia nebo odpovídající ročník víceletého gymnázia. Může nabývat hodnot: I.-IV. V ostatních případech tato kategorie zůstává nevyplněná. |
doc.tr_gvicelete | Třída víceletého gymnázia. prima (1); sekunda (2); kvarta (4); kvinta (5); septima (7). Texty z tercie, sexty a oktávy se do výzkumu nepodařilo zařadit. V ostatních případech tato kategorie zůstává nevyplněná. |
TEXT | |
doc.tx_tema | Téma písemné práce. |
doc.tx_tematyp | Téma písemné práce podle zadání. Může nabývat hodnot: volné; zadané; zadané s osnovou; výběr z určených témat. |
doc.tx_osnova | Osnova zadaná učitelem. Může nabývat hodnot: ano; ne. |
doc.tx_osnova_z | Realizace osnovy žákem. Může nabývat hodnot: ano; ne. |
doc.tx_zanrtyp | Typ žánru písemné práce podle zadání. Může nabývat hodnot: volný; zadaný; výběr z určených žánrů. |
doc.tx_pracetyp | Typ písemné práce. Může nabývat hodnot: školní; domácí. |
doc.tx_zanrnazev | Název žánru písemné práce. Může nabývat hodnot: vypravování; popis předmětu; popis osoby; popis děje; popis pracovního postupu; charakteristika; životopis; líčení; dopis osobní; výtah; žádost; úvaha; výklad; fejeton; proslov; jiný žánr. Další žánry v textech žáků jako jsou dopis úřední, zpráva či oznámení a výpisky se do výzkumu bohužel nepodařilo zařadit. |
doc.tx_zavaznost | Závažnost písemné práce. Může nabývat hodnot: vysoká; střední; nízká. |
doc.tx_cas | Čas na vypracování písemné práce. Může nabývat hodnot: vyučovací hodina; dvě vyuč. hodiny; libovolný čas (domácí práce); část vyučovací hodiny. |
doc.tx_situace | Situace při realizaci práce. Může nabývat hodnot: společný výběr tématu; společná inspirace (např. konkrétním textem či obrázkem); společná příprava osnovy; společný výběr jazykových prostředků; jiná situace při realizaci. |
doc.tx_hodnoceni | Hodnocení písemné práce. Může nabývat hodnot: 1=A; 2=B; 3=C; 4=D; 5=E; neklasif.; slovní; jiné hodnocení. |
ŽÁK | |
doc.z_num | Kód žáka. |
doc.z_pohlavi | Pohlaví žáka. Může nabývat hodnot: Ž – žena; nebo M – muž. |
doc.z_veknum | Věk žáka. Může nabývat hodnot 10–18 let (např. 11). |
doc.z_vek | Věkové kategorie u žáků. Může nabývat hodnot: do 11 let; 12 - 15 let; nad 15 let. |
doc.z_vzdelanityp | Vzdělání žáka. Může nabývat hodnot: ZŠ; nebo SŠ. Žáky jsme zařadili do ZŠ, nebo SŠ podle typu započatého studia. |
doc.z_pobytstat | Pobyt žáka v dětství – stát. Může nabývat hodnot: ČR; jiný stát. Tento údaj umožňuje vyhledat žáky, kteří žili v cizině nebo jsou cizinci. |
doc.z_detstvioblast | Pobyt žáka v dětství – nářeční oblast. Může nabývat hodnot: středočeská; jihozápadočeská; pohraničí české. Ve výzkumu nebylo zaznamenáno, že by žáci pocházeli z jiných nářečních oblastí. |
doc.z_soucasnaoblast | Současný pobyt mluvčího – nářeční oblast. Může nabývat hodnot: středočeská; jihozápadočeská; pohraničí české. |
doc.z_poznamky | Zvláštní poznámky u žáka. Mohou zde být různé komentáře, např. dyslexie, dysgrafie aj. |
UČITEL | |
doc.u_num | Kód učitele. |
doc.u_pohlavi | Pohlaví učitele. Může nabývat hodnot: Ž – žena; nebo M – muž. |
doc.u_veknum | Věk učitele. Hodnoty se pohybují od 26 do 64 let (např. 42). |
doc.u_vek | Věkové kategorie u učitele. Může nabývat hodnot: do 35 let; 35 - 60 let; nad 60 let. |
doc.u_vzdelanityp | Vzdělání učitele. Může nabývat hodnot: SŠ; VŠ. |