Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:oral:pravidla [2017/05/31 17:07] – [Interpunkční značky v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL)] zuzanakomrskova | cnk:oral:pravidla [2017/06/01 11:20] (aktuální) – [Transkripce jazykových jevů] petrapoukarova |
---|
====== Transkripce v korpusu ORAL ====== | ====== Transkripce v korpusu ORAL ====== |
Korpus ORAL sdružuje tři již publikované korpusy ([[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]], [[cnk:oral2013|ORAL2013]]) a k nim přibyvší data označená jako Z-ORAL. Pravidla pro transkripci se postupem času měnila, bylo proto nutné data sjednotit a upravit. | Korpus [[cnk:oral|ORAL]] sdružuje tři již publikované korpusy ([[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]], [[cnk:oral2013|ORAL2013]]) a k nim přibyvší data označená jako ORAL-Z. Pravidla pro transkripci se postupem času měnila, bylo proto nutné data sjednotit a [[cnk:oral#vytvoreni_korpusu_oral|upravit]]. Tato stránka shrnuje proměny transkripce napříč všemi třemi korpusy řady ORAL a sjednoceným korpusem ORAL. |
| |
===== Transkripce jazykových jevů v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL) ===== | ===== Transkripce jazykových jevů ===== |
^ Pojmenování jevu ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ^ | ^ Pojmenování jevu ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ^ |
| **ustálená zjednodušená výslovnost** | <fc #ff0000>//pudu, vemu, výde, pocem, dyž, neska, ňák, ďáli, štyry/štyři/čtyry/čtyři, pošta/počta, myslím/myslim/mysim//</fc>((Toto není ani zdaleka vyčerpávající výčet; zejména pokud hledáte frekventovaná/výplňková slova (//protože//, //vlastně// atp.), důrazně doporučujeme nahlédnout do pravidel pro přepis korpusů [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a {{:cnk:prepisovaci_pravidla_oral2013.pdf|ORAL2013}}, zda se v nich nepočítá s různými variantami.)) |||| | | **ustálená zjednodušená výslovnost** | <fc #ff0000>//pudu, vemu, výde, pocem, dyž, neska, ňák, ďáli, štyry/štyři/čtyry/čtyři, pošta/počta, myslím/myslim/mysim//</fc>((Toto není ani zdaleka vyčerpávající výčet; zejména pokud hledáte frekventovaná/výplňková slova (//protože//, //vlastně// atp.), důrazně doporučujeme nahlédnout do pravidel pro přepis korpusů [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a {{:cnk:prepisovaci_pravidla_oral2013.pdf|ORAL2013}}, zda se v nich nepočítá s různými variantami.)) |||| |
| - **před R L M N Ň J** | dle pravopisu:\\ //s máslem// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme, kvůli/gvůli// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //s máslem// i //z máslem//, //kupme// i //kubme//</fc> | | | - **před R L M N Ň J** | dle pravopisu:\\ //s máslem// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme, kvůli/gvůli// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //s máslem// i //z máslem//, //kupme// i //kubme//</fc> | |
| - **skupina sh-** | dle pravopisu:\\ //shoda// | dle výslovnosti:\\ //schoda/zhoda// || <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //schoda// i //zhoda//</fc> | | | - **skupina sh-** | dle pravopisu:\\ //shoda// | dle výslovnosti:\\ //schoda/zhoda// || <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //schoda// i //zhoda//</fc> | |
| **asimilace místa tvoření** | dle pravopisu:\\ //rozčesat, sčítat// || dle výslovnosti:\\ //roščesat//((S výjimkou asimilace místa tvoření zachováváme předponu roz-, viz výše)), //ščítat// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //rozčesat// i //roščesat//</fc> | | | **asimilace místa tvoření** | dle pravopisu:\\ //rozčesat, sčítat// || dle výslovnosti:\\ //roščesat//((S výjimkou asimilace místa tvoření zachováváme předponu roz-, viz výše.)), //ščítat// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //rozčesat// i //roščesat//</fc> | |
| **hranice slov** | <fc #ff0000>respektují se:\\ //pod čepicí// (**NE** //počepicí//), //to jo, no no//</fc> |||| | | **hranice slov** | <fc #ff0000>respektují se:\\ //pod čepicí// (**NE** //počepicí//), //to jo, no no//</fc> |||| |
| **kvantita** | <fc #ff0000>zachycuje se **krácení** v koncovkách i základech slov:\\ //rohlik, vim, žensky (=ženský)//</fc> |||| | | **kvantita** | <fc #ff0000>zachycuje se **krácení** v koncovkách i základech slov:\\ //rohlik, vim, žensky (=ženský)//</fc> |||| |
| **verbalizovaný smích** | <fc #ff0000>zápis dle slyšeného:\\ //haha/ha ha, chichi/chi chi//</fc> |||| | | **verbalizovaný smích** | <fc #ff0000>zápis dle slyšeného:\\ //haha/ha ha, chichi/chi chi//</fc> |||| |
| |
===== Znaky a symboly použité v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL) ===== | ===== Znaky a symboly ===== |
^ Jev ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ^ | ^ Jev ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ^ |
| **nedořečené, neúplné slovo** | <fc #ff0000>značí se hvězdičkou ''*'':\\ //koč* *ková nekázeň//</fc> |||| | | **nedořečené, neúplné slovo** | <fc #ff0000>značí se hvězdičkou ''*'':\\ //koč* *ková nekázeň//</fc> |||| |
| **nesrozumitelný úsek** | značí se %%---%% ||| <fc #ff0000>značí se **kulatými závorkami**, nesrozumitelné úseky zapisovány jako komentář:\\ ''(nesrozumitelné)''</fc> | | | **nesrozumitelný úsek** | značí se %%---%% ||| <fc #ff0000>značí se **kulatými závorkami**, nesrozumitelné úseky zapisovány jako komentář:\\ ''(nesrozumitelné)''</fc> | |
| **neukončené promluvy** | značí se ''...:''\\ //mysim že budu mít co dělat abych ...:// ||| <fc #ff0000>značí se pomocí **minus** ''-'':\\ //mysim že budu mít co dělat abych -//</fc> | | | **neukončené promluvy** | značí se ''...:''\\ //mysim že budu mít co dělat abych ...:// ||| <fc #ff0000>značí se pomocí **minus** ''-'':\\ //mysim že budu mít co dělat abych -//</fc> | |
| **přerušení promluvy** | značí se ... na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš ...//\\ mluvčí 2: //no//\\ mluvčí 1: //... přejedeš řeku// ||| <fc #ff0000>značí se pomocí **+** na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš +//\\ mluvčí 2: //no//\\ mluvčí 1: //+ přejedeš řeku//</fc> | | | **přerušení promluvy** | značí se ... na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš ...//\\ mluvčí 2: //no//\\ mluvčí 1: //... přejedeš řeku// ||| <fc #ff0000>značí se pomocí **plus** ''+'' na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš +//\\ mluvčí 2: //no//\\ mluvčí 1: //+ přejedeš řeku//</fc> | |
| **poznámka, vysvětlivka v přepisu** | <fc #ff0000>zapisuje se do kulatých závorek ''()'':\\ //(smích) (cizojazyčný projev) (citoslovce) (odmlčení)//</fc>((Tj. výrazně dlouhá pauza.)) |||| | | **poznámka, vysvětlivka v přepisu** | <fc #ff0000>zapisuje se do kulatých závorek ''()'':\\ //(smích) (cizojazyčný projev) (citoslovce) (odmlčení)//</fc>((Tj. výrazně dlouhá pauza.)) |||| |
| |
===== Interpunkční značky v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL) ===== | ===== Interpunkční značky ===== |
| ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ||| | | ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ||| |
| | | | ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 + Z-ORAL | | | | | | ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 + Z-ORAL | |