Toto je starší verze dokumentu!
Ortografická rovina
Pod první tabulku:
Když odpovídá jednomu ortografickému slovu několik zvukových a hranicím mezi nimi spojovníky, rozděluje se na nich ortografické slovo na zvláštní tokeny, aby se omezilo používání rovnítek =
na fonetické rovině (viz dále), např. místo Rakousko-Uhersko
jsou dva tokeny Rakousko Uhersko
(ale např. e-mail
zůstává). V ostatních případech se řídí hranice slov PČP.1)
Na konec stránky:
Rozdíly ve vertikále a KonTextu
Tokenizace
Tokenizace vychází z ortografických slov (tzn. z ortografické roviny), přízvukové takty (zvuková slova) se obalují strukturou <pw>
.
Když odpovídá několika ortografickým slovům jedno zvukové, rozděluje se na svislicích na zvláštní tokeny.
Ortografická rovina | Fonetická rovina | Vertikála/KonText |
---|---|---|
ještě jsem jim | ešťe|sem|jim | <pw> |
(Když odpovídá jednomu ortografickému slovu několik zvukových, zůstávají jako jeden token oddělena rovnítky =
; v tom případě je v jedné struktuře <pw>
nutně více přízvukových taktů.)
Ortografická rovina | Fonetická rovina | Vertikála/KonText |
---|---|---|
sedmatřicet | sedəma=třicet | <pw> |
Křížky
Křížky #
(na ortografické rovině) se mažou.
Otazníky
Otazníky ?
se doplňují podle ortografické roviny i na fonetickou.
Struktury na rovině ort a fon
Překryvy
Hranaté závorky []
se nahrazují strukturou <overlap>
.
Nesrozumitelné úseky
Kulaté závorky ()
se nahrazují strukturou <unclear>
a počet nesrozumitelných slov odpovídajícím množstvím vlnovek ~
jako samostatných tokenů.
Zdůraznění
(Složené závorky {}
zůstávají, protože může být zdůrazněna i jen část tokenu.)
Metajazykové informace
Špičaté závorky <>
se nahrazují strukturou <para>
a značka atributem type
s popisem plnými slovy:
Značka | Popis |
---|---|
CP | cizojazyčný projev |
CT | čtený text |
HR | záměrné zkomolení (jazyková hra) |
IM | imitace |
KR | s křikem |
NH | nahlas |
PL | s pláčem |
PP | s plnou pusou |
PR | přeřeknutí |
PT | potichu |
PZ | s povzdechem |
RC | recitováno |
RL | rychle |
SB | slabikováno |
SM | se smíchem |
SP | šeptem |
ZP | zpíváno |
ZV | se zíváním |
MZ | mluví ke zvířeti |
HL | hlášení |
JO | jiná osoba |
1JO , … | jiná osoba č. 1 , … |
JO5 , … | jiná osoba (dítě, věk 5 let) |
Jestliže je více informací pohromadě, místo podtržítek _
se oddělují svislicemi |
.
Metajazykové informace na rovině meta
Poznámka dlouhá pauza
se nahrazuje třemi tečkami …
, ostatní se jen obalují kulatými závorkami; všechny poznámky (tzn. i několikaslovné) jsou jeden token.