Obsah

Zásady pro přepis korpusu SKRIPT2012

Přepis je koncipován tak, aby v přepsaném textu zůstalo zachováno maximum informací obsažených v původním rukopisu, zpracovatelé tedy v žádném případě text neopravovali ani neupravovali. Přepsán byl pouze text žáka a případné učitelem zadané úseky textu, sloužící žákovi jako vodítko (např. začátek práce, osnova atp.). Nebyly přepisovány komentáře a poznámky učitele, ani jeho opravy.

Pouze v případě určitých úseků, zvláště u problematických částí textu (např. nečitelný text ap.), je přepis doprovázen smluvenými znaky a kódy.

Pro identifikaci vybraných jevů se používají následující kódy:

<dt> část textu zadaná učitelem;
<dt cp osn> celý text osnovy (zadané učitelem);
<li> přepis odrážek v textu žáka;
<img> obrázek v textu žáka;
<priv> osobní údaje (např. adresa, mail, telefonní číslo).

Tzv. chybové kódy:

<ni > interpretace nečitelného textu zpracovatelem;
<co>  komentář zpracovatele textu k jednomu konkrétnímu slovu;
<co para> komentář zpracovatele textu k příslušnému odstavci;
<co doc> komentář zpracovatele textu k celému dokumentu/k práci;
<.> ; <?> chybějící interpunkční znaménko v textu žáka.

Zásady transkripce

Sporné a problémové jevy

Pro sporné a problémové jevy se používají následující znaky: < >; { }; XXX.

Závorky

Nečitelné či přeškrtané řetězce (znak XXX, kód <ni>)

Komentář přepisovače

Obrázky v textu (kód <img>)

Kódování jmen a osobních údajů