Přepisovací pravidla pro korpus ORAL2006 připravil PhDr. Pavel Jančák, CSc. Vycházel přitom z pravidel užívaných v PMK. V průběhu sběru dat pak došlo k některým dílčím změnám, výsledkem jsou následující zásady.
Přepis slov se blíží co nejvíce tradičnímu zápisu, tedy ne fonetické transkripci. V těch případech, kdy se svými ustálenými podobami běžná mluva pravidelně odlišuje od výslovnosti spisovné, tradiční zápis nerespektujeme a zaznamenáváme tuto odlišnou výslovnost. Píšeme tedy např. sem (= jsem), pudu (= půjdu), já si to vemu (= vezmu). Tam, kde ustálená zjednodušená výslovnost byla nevýrazná (tj. kdy zjednodušení souhláskové skupiny bylo nezřetelné), dáváme v zápise přednost podobě spisovné. V těch pravidelných jevech, kde se i tradiční forma psaná od formy mluvené (ať spisovné, či nespisovné) vždy odlišuje, se zapisuje touto formou zápisu (rozdíl i – y; dě, tě, ně; bě, pě, mě; spodoba znělosti atd.). Odlišná kvantita se registruje, a to jak kvantita fonologická (regionální podoby rohlik, klucí, pánove, pět kluku), tak emfatická (bóže, a to i v případech jako bylo to dlóuhý). Neoznačuje se však prodlužování slabik na konci kóla a prodlužování dané váháním (v případech jako já sem tam přišél, no a voni tam už byli). V zápisech mohou být i dublety, přičemž někdy jde o dublety regionální (počta – pošta).
Nedořečené slovo označujeme hvězdičkou za slovem a čárkou (to bylo vče*, převčírem). Pokud za nedořečeným slovem následuje totéž slovo, ale už dořečené, oddělují se jen mezerou (nedo* nedořečené, i v případě, kdy jde o přeřeknutí jako neda* nedořečené). Různé parazitní zvukové projevy doprovázející mluvený projev označujeme seskupením vždy tří písmen, a to většinou hmm pro zvuky spíše souhláskové a eee pro zvuky spíše vokalické. Přerušení promluvy smíchem značíme poznámkou v kulatých závorkách (smích). Pokud lze smích verbalizovat (mluvčí pronese něco jako no haha), přepisujeme co nejblíže slyšenému.
Hranice vět se vyznačují jen interpunkcí, na začátku věty píšeme malé písmeno. Větné interpunkce se užívá tak, jak je to obvyklé v textech psaných, tj. nezachycujese přerušování věty pauzami, naopak náležitou čárku ve větách a v souvětích píšeme, i když se větné předěly pauzou nerealizují. Neukončené věty označujeme třemi tečkami s dvojtečkou odsazenými mezerou, tedy …: Případ, kdy je mluvčí přerušen jiným mluvčím, ale ve výpovědi později pokračuje, se v dialogu značí třemi tečkami na konci přerušené výpovědi i nazačátku její navazující části. Pokud je nutné zapsat do textu poznámku nebo vysvětlivku k nějaké mimořádné situaci, užívají se k odlišení takového textu kulaté závorky. Úseky, které se nepodaří při přepisu rozluštit, se vyznačují sérií tří krátkých pomlček.
Kvůli anonymitě jsou kódována příjmení a přezdívky, tj. nahrazena zkratkami NP
za příjmení a NN
za přezdívku. Na přání mluvčích mohou být kódována i křestní jména (NJ
) a místní názvy (NM
).
— Martina Waclawičová