Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Následující verze Obě strany příští revize
cnk:ortofon:pravidla [2017/05/30 10:28]
Zuzana Komrsková [Fonetická rovina]
cnk:ortofon:pravidla [2017/05/31 17:51]
davidlukes [Transkripce v korpusu ORTOFON]
Řádek 1: Řádek 1:
-====== Pravidla pro přepis nahrávek v korpusu ORTOFON  ======+====== Transkripce v korpusu ORTOFON  ======
  
 Pro přepis byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jež umožňuje propojení vícerovňového přepisu se zvukem. Pro přepis byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jež umožňuje propojení vícerovňového přepisu se zvukem.
 Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu.  Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu. 
 +
 +<WRAP center round important 60%>
 +Pravidla zde popsaná se týkají zdrojových přepisů v programu ELAN (formát EAF), které mohou být poskytnuty na vyžádání. Pro zpřístupnění přes rozhraní [[https://kontext.korpus.cz|KonText]] byly některé aspekty transkripce upraveny s ohledem na technické požadavky rozhraní a usnadnění vyhledávání. Víc viz [[kurz:hledani_ortofon|Hledání v korpusu ORTOFON]].
 +</WRAP>
 +
  
 ==== Ortografická rovina ==== ==== Ortografická rovina ====
Řádek 33: Řádek 38:
 | **hezitace**  |  ''@''  |  kratší hezitace ''@''\\ delší hezitace ''@@''  |  //potom bychom pravděpodobně @ .. připravili nějaký seznam//  | | **hezitace**  |  ''@''  |  kratší hezitace ''@''\\ delší hezitace ''@@''  |  //potom bychom pravděpodobně @ .. připravili nějaký seznam//  |
 | **nedořečené, neúplné slovo** |  ''*''  |  na začátku nebo na konci srozumitelné části slova    //přizpůso* přizpůsobujou//  | | **nedořečené, neúplné slovo** |  ''*''  |  na začátku nebo na konci srozumitelné části slova    //přizpůso* přizpůsobujou//  |
-| **příklonné s** |  ''#''  |  značí se křížkem    //byl #s, že #s//  |+| **příklonné s**, **spojka li**, **typ proň, zaň** |  ''#''  |  značí se křížkem    //byl #s, ne #li, pro #ň//  |
 | **otázka** |  ''?''  |    |  //to byl jeho syn ?//  | | **otázka** |  ''?''  |    |  //to byl jeho syn ?//  |
 | **neukončené promluvy** |  ''-''  |  vždy na konci repliky  |  //ale za moc nestojí ten je nějakej -//  | | **neukončené promluvy** |  ''-''  |  vždy na konci repliky  |  //ale za moc nestojí ten je nějakej -//  |
Řádek 42: Řádek 47:
  
 ^ Anonymizační značka ^  Vysvětlení  ^ ^ Anonymizační značka ^  Vysvětlení  ^
-| NP | příjmení | +''NP'' | příjmení | 
-| NJ | křestní jméno | +''NJ'' | křestní jméno | 
-| NN | přezdívka | +''NN'' | přezdívka | 
-| NM | místní jméno | +''NM'' | místní jméno | 
-| NO | ostatní vlastní jména | +''NO'' | ostatní vlastní jména | 
-| NT | poslední dvojčíslí telefonního čísla |+''NT'' | poslední dvojčíslí telefonního čísla |
  
 ==== Fonetická rovina ==== ==== Fonetická rovina ====
Řádek 65: Řádek 70:
 |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ | |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ |
  
-Druhou zásadou fonetického přepisu je důsledná **korespondence mezi vrstvou ortografickou a fonetickou**. Tedy vše, co je součástí ortografického přepisu, musí být zachováno i na fonetické úrovni – značíme shodně **překryvy**, **pauzy**, **symboly pro (ne)ukončení replik**, zachováváme **anonymizační značky**, **kulaté závorky** pro nesrozumitelné úseky, neverbální zvuky ve **špičatých závorkách**. Co naopak při fonetické transkrupci **nezachováváme**, jsou **otazník**, **spojovník**, **hvězdička**, signalizující nedokončené slov, ani **křížek** před příklonným s či spojkou li.  +Druhou zásadou fonetického přepisu je důsledná **korespondence mezi vrstvou ortografickou a fonetickou**. Tedy vše, co je součástí ortografického přepisu, musí být zachováno i na fonetické úrovni – značíme shodně **překryvy**, **pauzy**, **symboly pro (ne)ukončení replik**, zachováváme **anonymizační značky**, **kulaté závorky** pro nesrozumitelné úseky, neverbální zvuky ve **špičatých závorkách**. Co naopak při fonetické transkripci **nezachováváme**, jsou **otazník**, **spojovník**, **hvězdička**, signalizující nedokončená slova, ani **křížek** před příklonným s či spojkou li.  
 Požadavku na korespondenci ortografické a fonetické roviny odpovídá i členění na přízvukové takty za pomoci svislítek a rozdělování jednoho ortografického slova do více taktů za pomoci rovnítka (viz výše). Požadavku na korespondenci ortografické a fonetické roviny odpovídá i členění na přízvukové takty za pomoci svislítek a rozdělování jednoho ortografického slova do více taktů za pomoci rovnítka (viz výše).
  
Řádek 122: Řádek 127:
  
 ==== Metajazyková rovina ==== ==== Metajazyková rovina ====
-Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. [[kurz:hledani_v_mluvenych_korpusech|využití pro hledání v mluvených korpusech]]), což umožňuje lepší orientaci a vyhledávání.+Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. využití pro hledání [[kurz:hledani_v_mluvenych_korpusech|v mluvených korpusech řady ORAL]]), což umožňuje lepší orientaci a [[kurz:hledani_ortofon|vyhledávání]]. 
 + 
 +==== Autoři pravidel přepisu==== 
 +ortografický zápis: Kopřivová,M. - Benešová,L. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. 
 + 
 +fonetický zápis: Benešová,L. - Kopřivová, M. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. 
 + 
 +==== Poděkování ==== 
 + 
 +Za pomoc s přípravou transkripčních pravidel chceme pokovat především prof. Marii Krčmové z FF MU v Brně, doc. Janu Volínovi, doc. Radku Skarnitzlovi a dr. Lence Weingartové z Fonetického ústavu FF UK. 
 + 
 +===== Související odkazy ===== 
 + 
 +<WRAP round box 72%> 
 +[[cnk:ortofon|ORTOFON]] • [[cnk:oral|ORAL]] • [[cnk:oral2006|ORAL2006]] • [[cnk:oral2008|ORAL2008]] • [[cnk:oral2013|ORAL2013]] • [[cnk:dialekt|Dialekt]] • [[pojmy:mluveny|Korpus mluveného jazyka]] • [[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|Struktura korpusů ORAL]] • [[kurz:hledani_v_mluvenych_korpusech|Hledání v mluvených korpusech]] • [[kurz:hledani_ORTOFON|Hledání v korpusu ORTOFON]] 
 + </WRAP>