Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Následující verze Obě strany příští revize
cnk:ortofon:pravidla [2017/05/30 10:28]
Zuzana Komrsková [Fonetická rovina]
cnk:ortofon:pravidla [2017/05/31 17:49]
davidlukes [Transkripce v korpusu ORTOFON]
Řádek 1: Řádek 1:
-====== ​Pravidla pro přepis nahrávek ​v korpusu ORTOFON ​ ======+====== ​Transkripce ​v korpusu ORTOFON ​ ======
  
 Pro přepis byl použit transkripční program [[https://​tla.mpi.nl/​tools/​tla-tools/​elan/​|ELAN]],​ jež umožňuje propojení vícerovňového přepisu se zvukem. Pro přepis byl použit transkripční program [[https://​tla.mpi.nl/​tools/​tla-tools/​elan/​|ELAN]],​ jež umožňuje propojení vícerovňového přepisu se zvukem.
 Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu. ​ Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu. ​
 +
 +<WRAP center round important 60%>
 +Pravidla zde popsaná se týkají zdrojových přepisů v programu ELAN (formát EAF), které mohou být poskytnuty na vyžádání. Pro zpřístupnění přes rozhraní [[manualy:​kontext|KonText]] byly některé aspekty transkripce upraveny s ohledem na technické požadavky rozhraní a usnadnění vyhledávání. Víc viz [[kurz:​hledani_ortofon|Hledání v korpusu ORTOFON]].
 +</​WRAP>​
 +
  
 ==== Ortografická rovina ==== ==== Ortografická rovina ====
Řádek 33: Řádek 38:
 | **hezitace** ​ |  ''​@'' ​ |  kratší hezitace ''​@''​\\ delší hezitace ''​@@'' ​ |  //potom bychom pravděpodobně @ .. připravili nějaký seznam// ​ | | **hezitace** ​ |  ''​@'' ​ |  kratší hezitace ''​@''​\\ delší hezitace ''​@@'' ​ |  //potom bychom pravděpodobně @ .. připravili nějaký seznam// ​ |
 | **nedořečené,​ neúplné slovo** |  ''​*'' ​ |  na začátku nebo na konci srozumitelné části slova   ​| ​ //​přizpůso* přizpůsobujou// ​ | | **nedořečené,​ neúplné slovo** |  ''​*'' ​ |  na začátku nebo na konci srozumitelné části slova   ​| ​ //​přizpůso* přizpůsobujou// ​ |
-| **příklonné s** |  ''#'' ​ |  značí se křížkem ​  ​| ​ //byl #s, že #s//  |+| **příklonné s**, **spojka li**, **typ proň, zaň** |  ''#'' ​ |  značí se křížkem ​  ​| ​ //byl #s, ne #li, pro #ň//  |
 | **otázka** |  ''?'' ​ |    |  //to byl jeho syn ?//  | | **otázka** |  ''?'' ​ |    |  //to byl jeho syn ?//  |
 | **neukončené promluvy** |  ''​-'' ​ |  vždy na konci repliky ​ |  //ale za moc nestojí ten je nějakej -//  | | **neukončené promluvy** |  ''​-'' ​ |  vždy na konci repliky ​ |  //ale za moc nestojí ten je nějakej -//  |
Řádek 42: Řádek 47:
  
 ^ Anonymizační značka ^  Vysvětlení ​ ^ ^ Anonymizační značka ^  Vysvětlení ​ ^
-| NP | příjmení | +''​NP'' ​| příjmení | 
-| NJ | křestní jméno | +''​NJ'' ​| křestní jméno | 
-| NN | přezdívka | +''​NN'' ​| přezdívka | 
-| NM | místní jméno | +''​NM'' ​| místní jméno | 
-| NO | ostatní vlastní jména | +''​NO'' ​| ostatní vlastní jména | 
-| NT | poslední dvojčíslí telefonního čísla |+''​NT'' ​| poslední dvojčíslí telefonního čísla |
  
 ==== Fonetická rovina ==== ==== Fonetická rovina ====
Řádek 65: Řádek 70:
 |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//​\\ | |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//​\\ |
  
-Druhou zásadou fonetického přepisu je důsledná **korespondence mezi vrstvou ortografickou a fonetickou**. Tedy vše, co je součástí ortografického přepisu, musí být zachováno i na fonetické úrovni – značíme shodně **překryvy**,​ **pauzy**, **symboly pro (ne)ukončení replik**, zachováváme **anonymizační značky**, **kulaté závorky** pro nesrozumitelné úseky, neverbální zvuky ve **špičatých závorkách**. Co naopak při fonetické ​transkrupci ​**nezachováváme**,​ jsou **otazník**,​ **spojovník**,​ **hvězdička**,​ signalizující nedokončené slov, ani **křížek** před příklonným s či spojkou li.  ​+Druhou zásadou fonetického přepisu je důsledná **korespondence mezi vrstvou ortografickou a fonetickou**. Tedy vše, co je součástí ortografického přepisu, musí být zachováno i na fonetické úrovni – značíme shodně **překryvy**,​ **pauzy**, **symboly pro (ne)ukončení replik**, zachováváme **anonymizační značky**, **kulaté závorky** pro nesrozumitelné úseky, neverbální zvuky ve **špičatých závorkách**. Co naopak při fonetické ​transkripci ​**nezachováváme**,​ jsou **otazník**,​ **spojovník**,​ **hvězdička**,​ signalizující nedokončená slova, ani **křížek** před příklonným s či spojkou li.  ​
 Požadavku na korespondenci ortografické a fonetické roviny odpovídá i členění na přízvukové takty za pomoci svislítek a rozdělování jednoho ortografického slova do více taktů za pomoci rovnítka (viz výše). Požadavku na korespondenci ortografické a fonetické roviny odpovídá i členění na přízvukové takty za pomoci svislítek a rozdělování jednoho ortografického slova do více taktů za pomoci rovnítka (viz výše).
  
Řádek 122: Řádek 127:
  
 ==== Metajazyková rovina ==== ==== Metajazyková rovina ====
-Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. [[kurz:​hledani_v_mluvenych_korpusech|využití pro hledání ​v mluvených korpusech]]),​ což umožňuje lepší orientaci a vyhledávání.+Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. ​využití pro hledání ​[[kurz:​hledani_v_mluvenych_korpusech|v mluvených korpusech ​řady ORAL]]), což umožňuje lepší orientaci a [[kurz:​hledani_ortofon|vyhledávání]]. 
 + 
 +==== Autoři pravidel přepisu==== 
 +ortografický zápis: Kopřivová,​M. - Benešová,​L. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. 
 + 
 +fonetický zápis: Benešová,​L. - Kopřivová,​ M. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. 
 + 
 +==== Poděkování ==== 
 + 
 +Za pomoc s přípravou transkripčních pravidel chceme pokovat především prof. Marii Krčmové z FF MU v Brně, doc. Janu Volínovi, doc. Radku Skarnitzlovi a dr. Lence Weingartové z Fonetického ústavu FF UK. 
 + 
 +===== Související odkazy ===== 
 + 
 +<WRAP round box 72%> 
 +[[cnk:​ortofon|ORTOFON]] • [[cnk:​oral|ORAL]] • [[cnk:​oral2006|ORAL2006]] • [[cnk:​oral2008|ORAL2008]] • [[cnk:​oral2013|ORAL2013]] • [[cnk:​dialekt|Dialekt]] • [[pojmy:​mluveny|Korpus mluveného jazyka]] • [[pojmy:​atributy_strukturni#​strukturni_atributy_korpusu_rady_oral|Struktura korpusů ORAL]] • [[kurz:​hledani_v_mluvenych_korpusech|Hledání v mluvených korpusech]] • [[kurz:​hledani_ORTOFON|Hledání v korpusu ORTOFON]] 
 + </​WRAP>​