| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| cnk:ortofon:pravidla [2017/05/31 15:18] – [Související odkazy] zuzanakomrskova | cnk:ortofon:pravidla [2024/10/01 16:31] (aktuální) – Oprava odkazu na rozdíly v KonTextu vhorky |
|---|
| ====== Pravidla pro přepis nahrávek v korpusu ORTOFON ====== | ====== Transkripce v korpusu ORTOFON ====== |
| |
| Pro přepis byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jež umožňuje propojení vícerovňového přepisu se zvukem. | Pro přepis sond v korpusu [[cnk:ortofon|ORTOFON]] byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jenž umožňuje propojení vícerovňového přepisu se zvukem. |
| Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu. | Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu. |
| | |
| | <WRAP center round important 60%> |
| | Pravidla zde popsaná se týkají zdrojových přepisů v programu ELAN (formát EAF), které mohou být poskytnuty na vyžádání. Pro zpřístupnění přes rozhraní [[https://kontext.korpus.cz|KonText]] byly některé aspekty transkripce upraveny s ohledem na technické požadavky rozhraní a usnadnění vyhledávání. Víc viz [[cnk:ortofon:rozdily_v_kontextu|Rozdíly anotace korpusu ORTOFON v3 ve vertikále a KonTextu]]. |
| | </WRAP> |
| | |
| |
| ==== Ortografická rovina ==== | ==== Ortografická rovina ==== |
| |
| ^ Jev ^ Příklad ^ | ^ Jev ^ Příklad ^ |
| | **hranice slov** | respektují se:\\ //jo jo jo, že jo// | | | **hranice slov** | převážně se respektují (viz níže):\\ //jo jo jo, že jo// | |
| | **kvantita hlásek** | dle pravopisu:\\ //myslím, táta// | | | **kvantita hlásek** | dle pravopisu:\\ //myslím, táta// | |
| | **kvalita hlásek** | dle skutečné realizace:\\ //mlejn, vajco, kúpit// | | | **kvalita hlásek** | dle skutečné realizace:\\ //mlejn, vajco, kúpit// | |
| | **responzní zvuky přitakávací** | //hmm// | | | **responzní zvuky přitakávací** | //hmm// | |
| | **responzní zvuky odmítací** | //emm// | | | **responzní zvuky odmítací** | //emm// | |
| | |
| | Když odpovídá jednomu ortografickému slovu několik zvukových a hranicím mezi nimi spojovníky, rozděluje se na nich ortografické slovo na zvláštní tokeny, aby se omezilo používání rovnítek ''='' na fonetické rovině (viz dále). Spojovníky se přitom mažou, takže např. místo //Rakousko-Uhersko// jsou dva tokeny //Rakousko Uhersko//. Jako dva zvláštní tokeny bez spojovníku se uvádějí i složená adjektiva a adverbia, např. //rakousko uherský//. Slova odpovídající jednomu zvukovému slovu, např. //e-mail//, zůstávají dohromady, se spojovníkem. V ostatních případech se řídí hranice slov tokenizací podle standardu [[cnk:syn2020|SYN2020]]. |
| |
| V korpusu ORTOFON je použita **pauzová interpunkce**. Rozlišují se tři druhy pauz: | V korpusu ORTOFON je použita **pauzová interpunkce**. Rozlišují se tři druhy pauz: |
| | **hezitace** | ''@'' | kratší hezitace ''@''\\ delší hezitace ''@@'' | //potom bychom pravděpodobně @ .. připravili nějaký seznam// | | | **hezitace** | ''@'' | kratší hezitace ''@''\\ delší hezitace ''@@'' | //potom bychom pravděpodobně @ .. připravili nějaký seznam// | |
| | **nedořečené, neúplné slovo** | ''*'' | na začátku nebo na konci srozumitelné části slova | //přizpůso* přizpůsobujou// | | | **nedořečené, neúplné slovo** | ''*'' | na začátku nebo na konci srozumitelné části slova | //přizpůso* přizpůsobujou// | |
| | **příklonné s**, **spojka li**, **typ proň, zaň** | ''#'' | značí se křížkem | //byl #s, ne #li, pro #ň// | | | **příklonné s**, **spojka li**, **typ proň, zaň** | ''#'' | značí se křížkem | //byl#s, ne#li, pro#ň// | |
| | **otázka** | ''?'' | | //to byl jeho syn ?// | | | **otázka** | ''?'' | | //to byl jeho syn ?// | |
| | **neukončené promluvy** | ''-'' | vždy na konci repliky | //ale za moc nestojí ten je nějakej -// | | | **neukončené promluvy** | ''-'' | vždy na konci repliky | //ale za moc nestojí ten je nějakej -// | |
| ===Suprasegmentální jevy, které v přepisu zachycujeme=== | ===Suprasegmentální jevy, které v přepisu zachycujeme=== |
| ^ Popis jevu ^ Příklady ort ^ Příklady fon ^ | ^ Popis jevu ^ Příklady ort ^ Příklady fon ^ |
| |**přízvukové takty** jsou slova, která jsou sdružena pod jedním přízvukem, tvoří na fonetické rovině jedno „zvukové slovo“. \\ Protože ortografická a fonetická rovina si musí odpovídat,\\ všechny členy přízvukového taktu sice spojíme, ale na místo jejich hranice vložíme svislici | //to je\\ v tomhle\\ do háje\\ to #s\\ #s mohl//\\ | //tə''|''e\\ f''|''tomle\\ do''|''áje\\ to''|''s\\ s''|''moch//\\ | | |**přízvukové takty** jsou slova, která jsou sdružena pod jedním přízvukem, tvoří na fonetické rovině jedno „zvukové slovo“. \\ Protože ortografická a fonetická rovina si musí odpovídat,\\ všechny členy přízvukového taktu sice spojíme, ale na místo jejich hranice vložíme svislici | //to je\\ v tomhle\\ do háje// | //tə%%|%%e\\ f%%|%%tomle\\ do%%|%%áje// | |
| |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ | | |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ | |
| |
| |
| ==== Metajazyková rovina ==== | ==== Metajazyková rovina ==== |
| Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. [[kurz:hledani_v_mluvenych_korpusech|využití pro hledání v mluvených korpusech]]), což umožňuje lepší orientaci a vyhledávání. | Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. využití pro hledání [[kurz:hledani_v_mluvenych_korpusech|v mluvených korpusech řady ORAL]]), což umožňuje lepší orientaci a [[kurz:hledani_ortofon|vyhledávání]]. |
| |
| ==== Autoři pravidel přepisu==== | ==== Jak citovat přepisovací pravidla ==== |
| ortografický zápis: Kopřivová,M. - Benešová,L. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. | |
| |
| fonetický zápis: Benešová,L. - Kopřivová, M. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. | Benešová, L. – Komrsková, Z. – Kopřivová, M. – Lukeš, D. – Poukarová, P. – Škarpová, M.: //Pravidla transkripce pro korpus ORTOFON//. Ústav Českého národního korpusu FF UK, Praha 2012. Dostupné z WWW: https://wiki.korpus.cz/doku.php/cnk:ortofon:pravidla |
| |
| ==== Poděkování ==== | ==== Poděkování ==== |
| |
| Za pomoc s přípravou transkripčních pravidel chceme pokovat především prof. Marii Krčmové z FF MU v Brně, doc. Janu Volínovi, doc. Radku Skarnitzlovi a dr. Lence Weingartové z Fonetického ústavu FF UK. | Za pomoc s přípravou transkripčních pravidel chceme poděkovat především prof. Marii Krčmové z FF MU v Brně, doc. Janu Volínovi, doc. Radku Skarnitzlovi a dr. Lence Weingartové z Fonetického ústavu FF UK. |
| |
| ===== Související odkazy ===== | ===== Související odkazy ===== |
| |
| <WRAP round box 72%> | <WRAP round box 72%> |
| [[cnk:ortofon|ORTOFON]] • [[cnk:oral|ORAL]] • [[cnk:oral2006|ORAL2006]] • [[cnk:oral2008|ORAL2008]] • [[cnk:oral2013|ORAL2013]] • [[cnk:dialekt|Dialekt]] • [[pojmy:mluveny|Korpus mluveného jazyka]] • [[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|Struktura korpusů ORAL]] • [[kurz:hledani_v_mluvenych_korpusech|Hledání v mluvených korpusech]] • [[kurz:hledani_ORTOFON|Hledání v korpusu ORTOFON]] • [[cnk:ortofon:pravidla|Pravidla pro přepis nahrávek v korpusu ORTOFON]] | [[cnk:ortofon|ORTOFON]] • [[cnk:oral|ORAL]] • [[cnk:oral2006|ORAL2006]] • [[cnk:oral2008|ORAL2008]] • [[cnk:oral2013|ORAL2013]] • [[cnk:dialekt|Dialekt]] • [[pojmy:mluveny|Korpus mluveného jazyka]] • [[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|Struktura korpusů ORAL]] • [[kurz:hledani_v_mluvenych_korpusech|Hledání v mluvených korpusech]] • [[kurz:hledani_ORTOFON|Hledání v korpusu ORTOFON]] |
| </WRAP> | </WRAP> |