====== Zásady pro přepis korpusu SKRIPT2012 ====== Přepis je koncipován tak, aby v přepsaném textu zůstalo zachováno maximum informací obsažených v původním rukopisu, zpracovatelé tedy v žádném případě text neopravovali ani neupravovali. Přepsán byl pouze text žáka a případné učitelem zadané úseky textu, sloužící žákovi jako vodítko (např. začátek práce, osnova atp.). Nebyly přepisovány komentáře a poznámky učitele, ani jeho opravy. Pouze v případě určitých úseků, zvláště u problematických částí textu (např. nečitelný text ap.), je přepis doprovázen smluvenými **znaky** a **kódy**. Pro **identifikaci vybraných jevů** se používají následující **kódy**: > **
** část textu zadaná učitelem;\\ **
** celý text osnovy (zadané učitelem);\\ **
  • ** přepis odrážek v textu žáka;\\ **** obrázek v textu žáka;\\ **** osobní údaje (např. adresa, mail, telefonní číslo).\\ Tzv. **chybové kódy**: > **** interpretace nečitelného textu zpracovatelem;\\ ****  komentář zpracovatele textu k jednomu konkrétnímu slovu;\\ **** komentář zpracovatele textu k příslušnému odstavci;\\ **** komentář zpracovatele textu k celému dokumentu/k práci;\\ **<.> ; ** chybějící interpunkční znaménko v textu žáka.\\ ===== Zásady transkripce ===== * **Přepsána je reálná podoba textu** (výjimky jsou uvedeny níže).\\ Např.:\\ {{cnk:skript_obr1.png?357x50}}\\ V přepisu textu se vyskytuje "tři linki: zelený, žlytý a". * Při přepisu bylo nutné brát v potaz celý text a **respektovat způsob psaní autora**. * Zpracovatelé textu dodržovali **psaní velkých a malých písmen přesně podle originálu**, a to včetně všech chyb. Výjimku tvoří pouze grafické odchylky, které by bylo možno hodnotit jako nahodilé.\\ Např.:\\ {{cnk:skript_obr2.png?283x50}}\\ Je přepsáno jako „Město, kde se dobře“, nikoli jako „Město, Kde s dobŘe“. * Pokud se v původním textu objevilo **"i" a "j" bez tečky**, byla tečka v přepisu doplněna. * Když se v textu psaném na PC objevily **typografické chyby** (např. po tečce na konci věty nebo za čárkami nebyly mezery), zpracovatel textu je opravil podle typografických pravidel. * V ojedinělých případech se může stát, že v celém textu nejsou rozeznatelné **hranice mezi větami** (pisatel například neužívá interpunkci); takový text je zachován v původní podobě, tedy bez interpunkce. * Pokud v textu pisatel **zapomněl napsat tečku** za větou a mezi větami je zřetelný předěl (mezera, velké písmeno na začátku nové věty), bylo to zaznamenáno pomocí kódu <.> . V případě, že předěl není znát, je tento úsek přepsán tak, jak je zapsán v původním textu, tj. bez kódu <.>. * Pokud text obsahuje **tečky** (autor tím dává najevo, že přemýšlí o tématu, či jde o nedokončenou větu; může se vyskytovat i větší počet teček), jsou v přepisu vždy tři tečky.  * **Dělení slov na konci řádku** se nezaznamenává. * **Odrážky** ve všech grafických podobách se přepisují kódem
  • . Kód se píše vždy na začátek věty, každá odrážka s textem má pak podobu odstavce a odděluje se jedním prázdným řádkem. * **Předtištěný text** je přepsán pomocí kódu
    (žák navazuje na předtištěný text zadaný učitelem). Předtištěný text se nachází ve složených závorkách a hned za něj bez mezery je připsán kód
    .\\ Např.: //{Ahoj Jakube}
    . //\\ Pokud byl předtištěný text členěn do odstavců, zpracovatel textu ho přepsal do jednoho odstavce. * Obsahuje-li text **osnovu psanou žákem** (jím vymyšlenou), není kódována a je přepsána podle pravidel pro přepis. * Pokud se v některých textech objeví **osnova**, která byla **zadána učitelem** (tj. žák ji sám nevymyslel), je kódována pomocí kódu
    a je celý text osnovy vložen do složených závorek, které jsou bezprostředně před kódem
    bez mezery. * **Varianty** vzniklé v důsledku nejednoznačnosti rukopisného záznamu byly původně zpracovatelem textu přepsány jako //příjde|u//. V korpusu se nacházejí obě varianty vedle sebe, tedy //příjde příjdu//. ===== Sporné a problémové jevy ===== Pro sporné a problémové jevy se používají následující znaky: **< >; { }; XXX.**\\ === Závorky === * **Špičaté závorky** -- jsou vyhrazeny pro kódy (různé jevy), chybové kódy nebo chybějící interpunkci. * **Složené závorky** -- jsou vyhrazeny pro text, osnovu nebo komentář přepisovače, popřípadě pro komentář k tomu, že byl v korpusu nějaký znak nebo vzorec nahrazen. === Nečitelné či přeškrtané řetězce (znak XXX, kód ) === * Přeškrtané či začmárané řetězce v textu pisatele nejsou přepsány ani jinak vyznačeny. * Zcela nečitelná slova jsou zapsána jako XXX.\\ Např.: //Pracuju jako XXX//. * Byl-li zpracovatel textu schopen identifikovat počet nečitelných slov, uvedl XXX v příslušném počtu.\\ Např.: //Pracuju jako XXX XXX//. * Znak XXX je jeden celek, který se užívá jak pro písmeno či skupinu písmen, tak pro slovo; jen X se v těchto případech nikdy nepíše. * Znak XXX se používá pouze pro slova či slovní spojení, která do textu patří, ale zpracovatelé textu je nedokázali identifikovat. * Pokud bylo slovo nečitelné, ale zpracovatel textu byl schopen na základě kontextu nebo jiných skutečností interpretovat nějakou možnost čtení, mohl ji zapsat, a to pomocí kódu :\\ Např.: //Pracuje jako {dělník}.// === Komentář přepisovače === * Potřeboval-li zpracovatel textu k nějakému jevu přidat komentář/popis atp., použil kód ****. * Text komentáře je vždy ve složených závorkách a **komentář se vždy vztahuje jen k jednomu slovu.** ===== Obrázky v textu (kód ) ===== * Vyskytne-li se v textu obrázek (vlepený, kreslený, emotikon ap.), uvede se na příslušném místě kód se stručným (i víceslovným) popisem obrázku.\\ Např.: //šel tam pes ;\\ mám ráda chlupaté knedlíky // . * Není-li obrázek přímo v textu, kód je umístěn za nejbližší odstavec nebo na konec textu. * Emotikony se přepisují obvyklým způsobem; v korpusu jsou zastoupeny typy:\\ //    :-)>       //.   * Stejný kód platí pro i vlepený text, např. novinový článek, na který žáci píší reakci. Do závorky je pak připsáno "text o" a stručně je text popsán.\\ Např.: . ===== Kódování jmen a osobních údajů ===== * Kvůli anonymitě bylo nutné nahrazovat v textu **osobní jména** (rodná i příjmení), **která se týkala pisatele textu, jeho rodiny ap.** * Rodné jméno a příjmení jsou nahrazeny pouze rodnými jmény, a to následujícím způsobem: mužské jméno (rodné a příjmení): **Adam**; ženské jméno (rodné a příjmení): **Eva**; jméno, u něhož není možné identifikovat rod: **Sin**. * Ostatní jména (určená v zadání slohové práce, jednoznačně fiktivní, jména zvířat, přezdívky) jsou přepsána podle původního textu. * Pokud se v textu objevila dvě jména stejného rodu (např. jméno otce a bratra), která bylo nutno zakódovat, bylo použito zástupné jméno (bez jakéhokoliv číslování či jiného odlišování), tedy např. Adam a Adam. * Zdrobnělá jména, která bylo nutno zakódovat, se také kódují jako Adam, Eva, Sin (nezdrobňujeme na Evka, Adámek apod.). * V textu se také mohou vyskytovat jména pisatelů textu, která ale nejsou součástí textu (jde o klasický podpis slohové práce), tyto případy se nepřepisují. Přepisují se pouze tehdy, jestliže jsou součástí textu (podpis u dopisu, životopisu, ...), a tehdy se samozřejmě kódují. * Z příslušné školní práce jsou vymazány všechny údaje v záhlaví, např. jméno žáka, datum, pořadí práce, žánr práce (mohlo tam zůstat pouze téma práce a nadpis). V samotném textu jsou kódována všechna jména, která souvisí s pisatelem (jeho jméno, jména rodičů, kamarádů, učitelů ap.). * Pokud se v textu vyskytují **osobní údaje**, které prozrazují identitu pisatele, jsou zaznamenány pomocí kódu (adresa, datum narození, mail, telefonní číslo atd.).\\ Např.: //{adresa}, {datum narození}//. * **Jména měst, obcí nebo jejich částí a ulic** se zaznamenávají také s použitím kódu .\\ Např.: //{město}, {obec}, {ulice}//.