AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:ortofon:pravidla [2017/05/30 10:26] – [Ortografická rovina] Zuzana Komrskovácnk:ortofon:pravidla [2017/06/01 07:52] – [Transkripce v korpusu ORTOFON] Zuzana Komrsková
Řádek 1: Řádek 1:
-====== Pravidla pro přepis nahrávek v korpusu ORTOFON  ======+====== Transkripce v korpusu ORTOFON  ======
  
-Pro přepis byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jež umožňuje propojení vícerovňového přepisu se zvukem.+Pro přepis sond v korpusu [[cnk:ortofon|ORTOFON]] byl použit transkripční program [[https://tla.mpi.nl/tools/tla-tools/elan/|ELAN]], jenž umožňuje propojení vícerovňového přepisu se zvukem.
 Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu.  Hlavní transkripční zásadou bylo zachytit ve správném pořadí vše, co bylo vysloveno, tj. i nedořečená slova, falešné starty, několikanásobné opakování téhož výrazu, přeřeknutí a jeho opravu. 
 +
 +<WRAP center round important 60%>
 +Pravidla zde popsaná se týkají zdrojových přepisů v programu ELAN (formát EAF), které mohou být poskytnuty na vyžádání. Pro zpřístupnění přes rozhraní [[https://kontext.korpus.cz|KonText]] byly některé aspekty transkripce upraveny s ohledem na technické požadavky rozhraní a usnadnění vyhledávání. Víc viz [[kurz:hledani_ortofon|Hledání v korpusu ORTOFON]].
 +</WRAP>
 +
  
 ==== Ortografická rovina ==== ==== Ortografická rovina ====
Řádek 31: Řádek 36:
 ^  Jev  ^  Symbol  ^  Popis  ^  Příklad  ^  Jev  ^  Symbol  ^  Popis  ^  Příklad 
 | **citoslovce bez lexikalizované podoby**  |  ''&''  |    |   //oni právě jenom čumí a dělají jenom &//  | | **citoslovce bez lexikalizované podoby**  |  ''&''  |    |   //oni právě jenom čumí a dělají jenom &//  |
-| **hezitace**  |  ''@''  |  kratší hezitace @\\ delší hezitace @@  |  //potom bychom pravděpodobně @ .. připravili nějaký seznam//  |+| **hezitace**  |  ''@''  |  kratší hezitace ''@''\\ delší hezitace ''@@''   //potom bychom pravděpodobně @ .. připravili nějaký seznam//  |
 | **nedořečené, neúplné slovo** |  ''*''  |  na začátku nebo na konci srozumitelné části slova    //přizpůso* přizpůsobujou//  | | **nedořečené, neúplné slovo** |  ''*''  |  na začátku nebo na konci srozumitelné části slova    //přizpůso* přizpůsobujou//  |
-| **příklonné s** |  ''#''  |  značí se křížkem    //byl #s, že #s//  |+| **příklonné s**, **spojka li**, **typ proň, zaň** |  ''#''  |  značí se křížkem    //byl #s, ne #li, pro #ň//  |
 | **otázka** |  ''?''  |    |  //to byl jeho syn ?//  | | **otázka** |  ''?''  |    |  //to byl jeho syn ?//  |
 | **neukončené promluvy** |  ''-''  |  vždy na konci repliky  |  //ale za moc nestojí ten je nějakej -//  | | **neukončené promluvy** |  ''-''  |  vždy na konci repliky  |  //ale za moc nestojí ten je nějakej -//  |
Řádek 42: Řádek 47:
  
 ^ Anonymizační značka ^  Vysvětlení  ^ ^ Anonymizační značka ^  Vysvětlení  ^
-| NP | příjmení | +''NP'' | příjmení | 
-| NJ | křestní jméno | +''NJ'' | křestní jméno | 
-| NN | přezdívka | +''NN'' | přezdívka | 
-| NM | místní jméno | +''NM'' | místní jméno | 
-| NO | ostatní vlastní jména | +''NO'' | ostatní vlastní jména | 
-| NT | poslední dvojčíslí telefonního čísla |+''NT'' | poslední dvojčíslí telefonního čísla |
  
 ==== Fonetická rovina ==== ==== Fonetická rovina ====
Řádek 65: Řádek 70:
 |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ | |je-li jedno ortograficky psané slovo ve výslovnosti rozděleno **do více přízvukových taktů**,\\ jsou tyto takty odděleny rovnítkem, opět se mezi ně nevkládá mezera | //paní XY\\ ČVUT\\ ČVUT\\ ČSSD//\\ | //paňí iks=ipsilon\\ čé=vé=ú=té\\ čévéú=té\\ čéesez=dé//\\ |
  
-Druhou zásadou fonetického přepisu je důsledná **korespondence mezi vrstvou ortografickou a fonetickou**. Tedy vše, co je součástí ortografického přepisu, musí být zachováno i na fonetické úrovni – značíme shodně **překryvy**, **pauzy**, **symboly pro (ne)ukončení replik**, zachováváme **anonymizační značky**, **kulaté závorky** pro nesrozumitelné úseky, neverbální zvuky ve **špičatých závorkách**. Co naopak při fonetické transkrupci **nezachováváme**, jsou **otazník**, **spojovník**, **hvězdička**, signalizující nedokončené slov, ani **křížek** před příklonným s či spojkou li.  +Druhou zásadou fonetického přepisu je důsledná **korespondence mezi vrstvou ortografickou a fonetickou**. Tedy vše, co je součástí ortografického přepisu, musí být zachováno i na fonetické úrovni – značíme shodně **překryvy**, **pauzy**, **symboly pro (ne)ukončení replik**, zachováváme **anonymizační značky**, **kulaté závorky** pro nesrozumitelné úseky, neverbální zvuky ve **špičatých závorkách**. Co naopak při fonetické transkripci **nezachováváme**, jsou **otazník**, **spojovník**, **hvězdička**, signalizující nedokončená slova, ani **křížek** před příklonným s či spojkou li.  
 Požadavku na korespondenci ortografické a fonetické roviny odpovídá i členění na přízvukové takty za pomoci svislítek a rozdělování jednoho ortografického slova do více taktů za pomoci rovnítka (viz výše). Požadavku na korespondenci ortografické a fonetické roviny odpovídá i členění na přízvukové takty za pomoci svislítek a rozdělování jednoho ortografického slova do více taktů za pomoci rovnítka (viz výše).
  
Řádek 107: Řádek 112:
 Jiné znaky ve stopě **fon**:  Jiné znaky ve stopě **fon**: 
 ^  Používané  ^  Nepoužívané  ^ ^  Používané  ^  Nepoužívané  ^
-**.     ..  ** | **,     „“     ᾽     ;** | +''.     ..'' | **,     „“     ᾽     ;** | 
-**+** | | +''+'' | | 
-**-** | |+''-'' | |
 | ** ** | **–** | | ** ** | **–** |
 | ** ** | * | | ** ** | * |
-**( )** | | +''( )'' | | 
-**[ ]** | \\ |+''[ ]'' | \\ |
 | ** ** | **#** | | ** ** | **#** |
 | ** ** | **!      ?** | | ** ** | **!      ?** |
-**@   @@** | | +''@   @@'' | | 
-**NP, NJ **atd. | | +''NP, NJ'' atd. | | 
-**<SM> **atd. | | +''<SM> ''atd. | | 
-**{ }** | |+''{ }'' | |
  
 ==== Metajazyková rovina ==== ==== Metajazyková rovina ====
-Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. [[kurz:hledani_v_mluvenych_korpusech|využití pro hledání v mluvených korpusech]]), což umožňuje lepší orientaci a vyhledávání.+Tato rovina je určena pro zachycení neverbálních projevů mluvčích a doprovodných okolních zvuků. V korpusu ORTOFON byla sjednocena podoba takto zapisovaných poznámek (srov. využití pro hledání [[kurz:hledani_v_mluvenych_korpusech|v mluvených korpusech řady ORAL]]), což umožňuje lepší orientaci a [[kurz:hledani_ortofon|vyhledávání]]. 
 + 
 +==== Autoři pravidel přepisu==== 
 +ortografický zápis: Kopřivová,M. - Benešová,L. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. 
 + 
 +fonetický zápis: Benešová,L. - Kopřivová, M. - Škarpová, M. - Komrsková, Z. - Lukeš, D. - Poukarová, P. 
 + 
 +==== Poděkování ==== 
 + 
 +Za pomoc s přípravou transkripčních pravidel chceme pokovat především prof. Marii Krčmové z FF MU v Brně, doc. Janu Volínovi, doc. Radku Skarnitzlovi a dr. Lence Weingartové z Fonetického ústavu FF UK. 
 + 
 +===== Související odkazy ===== 
 + 
 +<WRAP round box 72%> 
 +[[cnk:ortofon|ORTOFON]] • [[cnk:oral|ORAL]] • [[cnk:oral2006|ORAL2006]] • [[cnk:oral2008|ORAL2008]] • [[cnk:oral2013|ORAL2013]] • [[cnk:dialekt|Dialekt]] • [[pojmy:mluveny|Korpus mluveného jazyka]] • [[pojmy:atributy_strukturni#strukturni_atributy_korpusu_rady_oral|Struktura korpusů ORAL]] • [[kurz:hledani_v_mluvenych_korpusech|Hledání v mluvených korpusech]] • [[kurz:hledani_ORTOFON|Hledání v korpusu ORTOFON]] 
 + </WRAP>