AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:ortofon:pravidla [2017/05/31 11:07] – [Fonetická rovina] petrapoukarovacnk:ortofon:pravidla [2024/10/01 16:31] (aktuální) – Oprava odkazu na rozdíly v KonTextu vhorky
Řádek 1: Řádek 1:
-====== Pravidla pro přepis nahrávek v korpusu ORTOFON  ======+====== Transkripce v korpusu ORTOFON  ======
  
-Pro přepis byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jež umožňuje propojení vícerovňového přepisu se zvukem.+Pro přepis sond v korpusu [[cnk:ortofon|ORTOFON]] byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jenž umožňuje propojení vícerovňového přepisu se zvukem.
 Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu.  Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu. 
 +
 +<WRAP center round important 60%>
 +Pravidla zde popsaná se týkají zdrojových přepisů v programu ELAN (formát EAF), které mohou být poskytnuty na vyžádání. Pro zpřístupnění přes rozhraní [[https://kontext.korpus.cz|KonText]] byly některé aspekty transkripce upraveny s ohledem na technické požadavky rozhraní a usnadnění vyhledávání. Víc viz [[cnk:ortofon:rozdily_v_kontextu|Rozdíly anotace korpusu ORTOFON v3 ve vertikále a KonTextu]].
 +</WRAP>
 +
  
 ==== Ortografická rovina ==== ==== Ortografická rovina ====
Řádek 8: Řádek 13:
  
 ^  Jev  ^  Příklad  ^   ^  Jev  ^  Příklad  ^  
-| **hranice slov** |  respektují se:\\ //jo jo jo, že jo//  |+| **hranice slov** |  převážně se respektují (viz níže):\\ //jo jo jo, že jo//  |
 | **kvantita hlásek** |  dle pravopisu:\\ //myslím, táta//  | | **kvantita hlásek** |  dle pravopisu:\\ //myslím, táta//  |
 | **kvalita hlásek** |  dle skutečné realizace:\\ //mlejn, vajco, kúpit//  | | **kvalita hlásek** |  dle skutečné realizace:\\ //mlejn, vajco, kúpit//  |
Řádek 21: Řádek 26:
 | **responzní zvuky přitakávací** |  //hmm//  | | **responzní zvuky přitakávací** |  //hmm//  |
 | **responzní zvuky odmítací** |  //emm//  | | **responzní zvuky odmítací** |  //emm//  |
 +
 +Když odpovídá jednomu ortografickému slovu několik zvukových a hranicím mezi nimi spojovníky, rozděluje se na nich ortografické slovo na zvláštní tokeny, aby se omezilo používání rovnítek ''='' na fonetické rovině (viz dále). Spojovníky se přitom mažou, takže např. místo //Rakousko-Uhersko// jsou dva tokeny //Rakousko Uhersko//. Jako dva zvláštní tokeny bez spojovníku se uvádějí i složená adjektiva a adverbia, např. //rakousko uherský//. Slova odpovídající jednomu zvukovému slovu, např. //e-mail//, zůstávají dohromady, se spojovníkem. V ostatních případech se řídí hranice slov tokenizací podle standardu [[cnk:syn2020|SYN2020]].
  
 V korpusu ORTOFON je použita **pauzová interpunkce**. Rozlišují se tři druhy pauz: V korpusu ORTOFON je použita **pauzová interpunkce**. Rozlišují se tři druhy pauz:
Řádek 33: Řádek 40:
 | **hezitace**  |  ''@''  |  kratší hezitace ''@''\\ delší hezitace ''@@''  |  //potom bychom pravděpodobně @ .. připravili nějaký seznam//  | | **hezitace**  |  ''@''  |  kratší hezitace ''@''\\ delší hezitace ''@@''  |  //potom bychom pravděpodobně @ .. připravili nějaký seznam//  |
 | **nedořečené, neúplné slovo** |  ''*''  |  na začátku nebo na konci srozumitelné části slova    //přizpůso* přizpůsobujou//  | | **nedořečené, neúplné slovo** |  ''*''  |  na začátku nebo na konci srozumitelné části slova    //přizpůso* přizpůsobujou//  |
-| **příklonné s**, **spojka li**, **typ proň, zaň** |  ''#''  |  značí se křížkem    //byl #s, ne #li, pro #ň//  |+| **příklonné s**, **spojka li**, **typ proň, zaň** |  ''#''  |  značí se křížkem    //byl#s, ne#li, pro#ň//  |
 | **otázka** |  ''?''  |    |  //to byl jeho syn ?//  | | **otázka** |  ''?''  |    |  //to byl jeho syn ?//  |
 | **neukončené promluvy** |  ''-''  |  vždy na konci repliky  |  //ale za moc nestojí ten je nějakej -//  | | **neukončené promluvy** |  ''-''  |  vždy na konci repliky  |  //ale za moc nestojí ten je nějakej -//  |
Řádek 62: Řádek 69:
 ===Suprasegmentální jevy, které v přepisu zachycujeme=== ===Suprasegmentální jevy, které v přepisu zachycujeme===
 ^  Popis jevu  ^  Příklady ort  ^  Příklady fon  ^ ^  Popis jevu  ^  Příklady ort  ^  Příklady fon  ^
-|**přízvukové takty** jsou slova, která jsou sdružena pod jedním přízvukem, tvoří na fonetické rovině jedno „zvukové slovo“. \\ Protože ortografická a fonetická rovina si musí odpovídat,\\ všechny členy přízvukového taktu sice spojíme, ale na místo jejich hranice vložíme svislici | //to je\\ v tomhle\\ do háje\\ to #s\\ #s mohl//\\ | //tə''|''e\\ f''|''tomle\\ do''|''áje\\ to''|''s\\ s''|''moch//\\ |+|**přízvukové takty** jsou slova, která jsou sdružena pod jedním přízvukem, tvoří na fonetické rovině jedno „zvukové slovo“. \\ Protože ortografická a fonetická rovina si musí odpovídat,\\ všechny členy přízvukového taktu sice spojíme, ale na místo jejich hranice vložíme svislici | //to je\\ v tomhle\\ do háje// | //tə%%|%%e\\ f%%|%%tomle\\ do%%|%%áje// |
 |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ | |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ |
  
Řádek 107: Řádek 114:
 Jiné znaky ve stopě **fon**:  Jiné znaky ve stopě **fon**: 
 ^  Používané  ^  Nepoužívané  ^ ^  Používané  ^  Nepoužívané  ^
-| ''    ..'' | |+| ''    ..''**,     „“     ᾽     ;** |
 | ''+'' | | | ''+'' | |
-| ''-'' (přerušení výpovědi) | | +| ''-'' | | 
-| ** ** | **–** (spojovník) |+| ** ** | **–** |
 | ** ** | * | | ** ** | * |
 | ''( )'' | | | ''( )'' | |
 | ''[ ]'' | \\ | | ''[ ]'' | \\ |
 | ** ** | **#** | | ** ** | **#** |
-| ** ** | **?** |+| ** ** | **!      ?** |
 | ''  @@'' | | | ''  @@'' | |
 | ''NP, NJ'' atd. | | | ''NP, NJ'' atd. | |
Řádek 122: Řádek 129:
  
 ==== Metajazyková rovina ==== ==== Metajazyková rovina ====
-Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. [[kurz:hledani_v_mluvenych_korpusech|využití pro hledání v mluvených korpusech]]), což umožňuje lepší orientaci a vyhledávání.+Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. využití pro hledání [[kurz:hledani_v_mluvenych_korpusech|v mluvených korpusech řady ORAL]]), což umožňuje lepší orientaci a [[kurz:hledani_ortofon|vyhledávání]].
  
-==== Autoři pravidel episu==== +==== Jak citovat episovací pravidla ====
-ortografický zápis: Kopřivová,M. - Benešová,L. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P.+
  
-fonetický zápis: Benešová,L. Kopřivová, M. - Škarpová, M. - Komrsková, Z. - Lukeš, D. Poukarová, P.+Benešová, L. – Komrsková, Z. – Kopřivová, M. – Lukeš, D. – Poukarová, P. – Škarpová, M.: //Pravidla transkripce pro korpus ORTOFON//. Ústav Českého národního korpusu FF UK, Praha 2012. Dostupné z WWW: https://wiki.korpus.cz/doku.php/cnk:ortofon:pravidla
  
 ==== Poděkování ==== ==== Poděkování ====
  
-Za pomoc s přípravou transkripčních pravidel chceme pokovat především prof. Marii Krčmové z FF MU v Brně, doc. Janu Volínovi, doc. Radku Skarnitzlovi a dr. Lence Weingartové z Fonetického ústavu FF UK.+Za pomoc s přípravou transkripčních pravidel chceme poděkovat především prof. Marii Krčmové z FF MU v Brně, doc. Janu Volínovi, doc. Radku Skarnitzlovi a dr. Lence Weingartové z Fonetického ústavu FF UK. 
 + 
 +===== Související odkazy ===== 
 + 
 +<WRAP round box 72%> 
 +[[cnk:ortofon|ORTOFON]] • [[cnk:oral|ORAL]] • [[cnk:oral2006|ORAL2006]] • [[cnk:oral2008|ORAL2008]] • [[cnk:oral2013|ORAL2013]] • [[cnk:dialekt|Dialekt]] • [[pojmy:mluveny|Korpus mluveného jazyka]] • [[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|Struktura korpusů ORAL]] • [[kurz:hledani_v_mluvenych_korpusech|Hledání v mluvených korpusech]] • [[kurz:hledani_ORTOFON|Hledání v korpusu ORTOFON]] 
 + </WRAP>