AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:oral:pravidla [2017/05/31 15:00] – [Interpunkční značky v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL)] petrapoukarovacnk:oral:pravidla [2017/06/01 11:20] (aktuální) – [Transkripce jazykových jevů] petrapoukarova
Řádek 1: Řádek 1:
 ====== Transkripce v korpusu ORAL  ====== ====== Transkripce v korpusu ORAL  ======
-Korpus ORAL sdružuje tři již publikované korpusy ([[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]], [[cnk:oral2013|ORAL2013]]) a k nim přibyvší data označená jako Z-ORAL. Pravidla pro transkripci se postupem času měnila, bylo proto nutné data sjednotit a upravit. +Korpus [[cnk:oral|ORAL]] sdružuje tři již publikované korpusy ([[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]], [[cnk:oral2013|ORAL2013]]) a k nim přibyvší data označená jako ORAL-Z. Pravidla pro transkripci se postupem času měnila, bylo proto nutné data sjednotit a [[cnk:oral#vytvoreni_korpusu_oral|upravit]]. Tato stránka shrnuje proměny transkripce napříč všemi třemi korpusy řady ORAL a sjednoceným korpusem ORAL.
  
-===== Transkripce jazykových jevů v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL)  =====+===== Transkripce jazykových jevů =====
 ^  Pojmenování jevu  ^  ORAL2006  ^  ORAL2008  ^  ORAL2013  ^  <fc #ff0000>ORAL </fc>  ^ ^  Pojmenování jevu  ^  ORAL2006  ^  ORAL2008  ^  ORAL2013  ^  <fc #ff0000>ORAL </fc>  ^
 | **ustálená zjednodušená výslovnost** |  <fc #ff0000>//pudu, vemu, výde, pocem, dyž, neska, ňák, ďáli, štyry/štyři/čtyry/čtyři, pošta/počta, myslím/myslim/mysim//</fc>((Toto není ani zdaleka vyčerpávající výčet; zejména pokud hledáte frekventovaná/výplňková slova (//protože//, //vlastně// atp.), důrazně doporučujeme nahlédnout do pravidel pro přepis korpusů [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a {{:cnk:prepisovaci_pravidla_oral2013.pdf|ORAL2013}}, zda se v nich nepočítá s různými variantami.))  |||| | **ustálená zjednodušená výslovnost** |  <fc #ff0000>//pudu, vemu, výde, pocem, dyž, neska, ňák, ďáli, štyry/štyři/čtyry/čtyři, pošta/počta, myslím/myslim/mysim//</fc>((Toto není ani zdaleka vyčerpávající výčet; zejména pokud hledáte frekventovaná/výplňková slova (//protože//, //vlastně// atp.), důrazně doporučujeme nahlédnout do pravidel pro přepis korpusů [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a {{:cnk:prepisovaci_pravidla_oral2013.pdf|ORAL2013}}, zda se v nich nepočítá s různými variantami.))  ||||
Řádek 14: Řádek 14:
 |  - **před R L M N Ň J**  |  dle pravopisu:\\ //s máslem//  |  dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme//  |  dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme, kvůli/gvůli//  |  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //s máslem// i //z máslem//, //kupme// i //kubme//</fc>  | |  - **před R L M N Ň J**  |  dle pravopisu:\\ //s máslem//  |  dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme//  |  dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme, kvůli/gvůli//  |  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //s máslem// i //z máslem//, //kupme// i //kubme//</fc>  |
 |  - **skupina sh-**  |  dle pravopisu:\\ //shoda//  |  dle výslovnosti:\\ //schoda/zhoda//  ||  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //schoda// i //zhoda//</fc>  | |  - **skupina sh-**  |  dle pravopisu:\\ //shoda//  |  dle výslovnosti:\\ //schoda/zhoda//  ||  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //schoda// i //zhoda//</fc>  |
-| **asimilace místa tvoření** |  dle pravopisu:\\ //rozčesat, sčítat//  ||  dle výslovnosti:\\ //roščesat//((S výjimkou asimilace místa tvoření zachováváme předponu roz-, viz výše)), //ščítat//  |  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //rozčesat// i //roščesat//</fc>  |+| **asimilace místa tvoření** |  dle pravopisu:\\ //rozčesat, sčítat//  ||  dle výslovnosti:\\ //roščesat//((S výjimkou asimilace místa tvoření zachováváme předponu roz-, viz výše.)), //ščítat//  |  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //rozčesat// i //roščesat//</fc>  |
 | **hranice slov** |  <fc #ff0000>respektují se:\\ //pod čepicí// (**NE** //počepicí//), //to jo, no no//</fc>  |||| | **hranice slov** |  <fc #ff0000>respektují se:\\ //pod čepicí// (**NE** //počepicí//), //to jo, no no//</fc>  ||||
 | **kvantita** |  <fc #ff0000>zachycuje se **krácení** v koncovkách i základech slov:\\ //rohlik, vim, žensky (=ženský)//</fc>  |||| | **kvantita** |  <fc #ff0000>zachycuje se **krácení** v koncovkách i základech slov:\\ //rohlik, vim, žensky (=ženský)//</fc>  ||||
 | ::: |  <fc #ff0000>zachycuje se **dloužení**  v koncovkách i základech slov, vč. emfatického dloužení:\\ //klucí, volál, sebú, bóže//</fc>  |||| | ::: |  <fc #ff0000>zachycuje se **dloužení**  v koncovkách i základech slov, vč. emfatického dloužení:\\ //klucí, volál, sebú, bóže//</fc>  ||||
 | **komparativ a superlativ** |  dle pravopisu:\\ //novější, pěknější, vlasatější//  ||  moravské realizace s dlouhým **ě** zapisujeme jako kombinaci **j** + **é**:\\ //novjéši, pěkňéši, vlasaťéši//  |  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //novější// i //novjéši//, //pěknější// i //pěkňéši//</fc>  | | **komparativ a superlativ** |  dle pravopisu:\\ //novější, pěknější, vlasatější//  ||  moravské realizace s dlouhým **ě** zapisujeme jako kombinaci **j** + **é**:\\ //novjéši, pěkňéši, vlasaťéši//  |  <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //novější// i //novjéši//, //pěknější// i //pěkňéši//</fc>  |
-| **zkratky** |  dle výslovnosti: pokud jako jedno slovo, píše se jako jedno slovo; pokud zvlášť, píše se zvlášť:\\ //dé vé dé/dý ví dý/dývídýčko, aids, ú es á//  |||| +| **zkratky** |  dle výslovnosti: pokud jako jedno slovo, píše se jako jedno slovo; pokud zvlášť, píše se zvlášť:\\ //dé vé dé/dý ví dý/dývídýčko, aids, ú es á//  |||  <fc #ff0000>byla-li zkratka zapsána odděleně (//ú es á//), bylo z ní vytvořeno jedno slovo (//úesá//)</fc>  
-| **neznámá X** |  zápis //iks//:\\ //po iks letech//  ||||+| **neznámá X** |  <fc #ff0000>zápis //iks//:\\ //po iks letech//</fc>  ||||
 | **velká písmena** |  <fc #ff0000>u vlastních jmen dle pravopisu</fc>  |||| | **velká písmena** |  <fc #ff0000>u vlastních jmen dle pravopisu</fc>  ||||
 | **cizí slova** |  <fc #ff0000>dle pravopisu:\\ //software//</fc>  |||| | **cizí slova** |  <fc #ff0000>dle pravopisu:\\ //software//</fc>  ||||
 | **hezitace** |  zvuky spíše souhláskové se zapisují:\\ //hmm//((Vždy pouze 3 písmena.))  ||  zvuky spíše souhláskové se zapisují:\\ //mmm//  |  <fc #ff0000>hlásková povaha hezitačních zvuků\\ se nerozlišuje, původní způsob zápisu\\ nahrazen symbolem //@//</fc>  | | **hezitace** |  zvuky spíše souhláskové se zapisují:\\ //hmm//((Vždy pouze 3 písmena.))  ||  zvuky spíše souhláskové se zapisují:\\ //mmm//  |  <fc #ff0000>hlásková povaha hezitačních zvuků\\ se nerozlišuje, původní způsob zápisu\\ nahrazen symbolem //@//</fc>  |
 | ::: |  zvuky spíše samohláskové se zapisují:\\ //eee//  ||| ::: |   | ::: |  zvuky spíše samohláskové se zapisují:\\ //eee//  ||| ::: |  
-| **responzní zvuky** |  viz **hezitace**   ||  spíše přitakávací zvuky:\\ //hmm//  || +| **responzní zvuky** |  viz **hezitace**   ||  <fc #ff0000>spíše přitakávací zvuky:\\ //hmm//</fc>  || 
-| ::: |  viz **hezitace**  ||  spíše nesouhlasné, odporovací zvuky:\\ //emm//  ||  +| ::: |  viz **hezitace**  ||  <fc #ff0000>spíše nesouhlasné, odporovací zvuky:\\ //emm//</fc>  ||  
-| **verbalizovaný smích** |  zápis dle slyšeného:\\ //haha/ha ha, chichi/chi chi//  ||||+| **verbalizovaný smích** |  <fc #ff0000>zápis dle slyšeného:\\ //haha/ha ha, chichi/chi chi//</fc>  ||||
  
-===== Znaky a symboly použité v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL)  ===== +===== Znaky a symboly ===== 
-^  Jev  ^  ORAL2006  ^  ORAL2008  ^  ORAL2013  ^  ORAL  ^ +^  Jev  ^  ORAL2006  ^  ORAL2008  ^  ORAL2013  ^  <fc #ff0000>ORAL </fc>  ^ 
-| **nedořečené, neúplné slovo** |  značí se hvězdičkou ''*'':\\ //koč**ková nekázeň//  |||| +| **nedořečené, neúplné slovo** |  <fc #ff0000>značí se hvězdičkou ''*'':\\ //koč* *ková nekázeň//</fc>  |||| 
-|  |  pokud za nedořečeným slovem následuje totéž slovo dořečené, **neoddělují** se čárkou:\\ //koč* kočka//  |||| +|  |  pokud za nedořečeným slovem následuje jiné slovo, **oddělují** se čárkou:\\ //přijde zít*, pozítří//  ||  <fc #ff0000>**neoddělují** se:\\ //přijde zít* pozítří//</fc>  ||  
-|  |  pokud za nedořečeným slovem následuje jiné slovo, **oddělují** se čárkou:\\ //přijde zít*, pozítří//  ||  **neoddělují** se:\\ //přijde zít* pozítří//  ||  +| **příklonné s** |  neznačí se  ||  značí se ''*s'':\\ //dělala *s//  |  <fc #ff0000>značí se ''#s'':\\ //dělala #s//</fc>  | 
-| **příklonné s** |  neznačí se  ||  značí se ''*s'':\\ //dělala *s//  |  značí se ''#s'':\\ //dělala #s//  | +| **spojovací výraz -li** |  psáno se spojovníkem ''-li'' a odsazeno od předchozího slova: \\ //dělala -li//  |||  <fc #ff0000>psáno s křížkem ''#li'' a odsazeno od předchozího slova:\\ //dělala #li//</fc>  | 
-| **spojovací výraz -li** |  psáno se spojovníkem ''-li'' a odsazeno od předchozího slova: \\ //dělala -li//  |||  psáno s křížkem ''#li'' a odsazeno od předchozího slova:\\ //dělala #li//  | +| **typ //proň, naň//** |  zapisuje se jako jedno slovo:\\ //proň//, //naň//  |||  <fc #ff0000>na slovním švu se vyděluje za pomoci **křížku** ''#'' předložka a redukovaná forma zájmena:\\ //pro #ň//, //za #ň//</fc>  | 
-| **typ //proň, naň//** |  zapisuje se jako jedno slovo:\\ //proň//, //naň//  |||  na slovním švu se vyděluje za pomoci **křížku** ''#'' předložka a redukovaná forma zájmena:\\ //pro #ň//, //za #ň//  | +| **nesrozumitelný úsek** |  značí se %%---%%  |||  <fc #ff0000>značí se **kulatými závorkami**, nesrozumitelné úseky zapisovány jako komentář:\\ ''(nesrozumitelné)''</fc>  | 
-| **nesrozumitelný úsek** |  značí se %%---%%  |||  značí se **kulatými závorkami**, nesrozumitelné úseky zapisovány jako komentář:\\ ''(nesrozumitelné)'' +| **neukončené promluvy** |  značí se ''...:''\\ //mysim že budu mít co dělat abych ...://  |||  <fc #ff0000>značí se pomocí **minus** ''-'':\\ //mysim že budu mít co dělat abych -//</fc>  | 
-| **neukončené promluvy** |  značí se ''...:''\\ //mysim že budu mít co dělat abych ...://  |||  značí se pomocí **minus** ''-'':\\ //mysim že budu mít co dělat abych -//  | +| **přerušení promluvy** |  značí se ... na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš ...//\\ mluvčí 2: //no//\\ mluvčí 1: //... přejedeš řeku//  |||  <fc #ff0000>značí se pomocí **plus** ''+'' na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš +//\\ mluvčí 2: //no//\\ mluvčí 1: //+ přejedeš řeku//</fc>  | 
-| **přerušení promluvy** |  značí se ... na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš ...//\\ mluvčí 2: //no//\\ mluvčí 1: //... přejedeš řeku//  |||  značí se pomocí **+** na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš +//\\ mluvčí 2: //no//\\ mluvčí 1: //+ přejedeš řeku// +| **poznámka, vysvětlivka v přepisu** |  <fc #ff0000>zapisuje se do kulatých závorek ''()'':\\ //(smích) (cizojazyčný projev) (citoslovce) (odmlčení)//</fc>((Tj. výrazně dlouhá pauza.))  ||||
-| **poznámka, vysvětlivka v přepisu** |  zapisuje se do kulatých závorek ''()'':\\ //(smích) (cizojazyčný projev) (citoslovce) (odmlčení)//((Tj. výrazně dlouhá pauza.))  ||||+
  
-===== Interpunkční značky v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL)  ===== +===== Interpunkční značky ===== 
-|    ORAL2006  ^  ORAL2008  ^  ORAL2013  ^  ORAL  ||| +|    ORAL2006  ^  ORAL2008  ^  ORAL2013  ^  <fc #ff0000>ORAL </fc>  ||| 
-| ||| ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 + Z-ORAL |  +| | | | ^  ORAL2006   ORAL2008   ORAL2013 + Z-ORAL  |  
-| **typ interpunkce** |   větná((dle psaného jazyka.))  ||  pauzová((Je nezávislá na psaném jazyce, značí se v ní realizované pauzy.))  |  čárka se užívá v místě předpokládaného konce věty (místo tečky)  ||  pauzová  |+| **typ interpunkce** |   větná((Dle psaného jazyka.))  ||  pauzová((Je nezávislá na psaném jazyce, značí se v ní realizované pauzy.))  |  čárka se užívá v místě předpokládaného konce věty (místo tečky)  ||  pauzová  |
 | **tečka (.)**  |  označuje konec promluvy  ||  tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim//  |  neužívá se  ||  tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim//  | | **tečka (.)**  |  označuje konec promluvy  ||  tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim//  |  neužívá se  ||  tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim//  |
 | **dvě tečky (..)**  |  neužívá se  ||  značí **střední pauzu**:\\ //no jo .. a co je eště novýho//  |  neužívá se  ||  značí **střední pauzu**:\\ //no jo .. a co je eště novýho//  | | **dvě tečky (..)**  |  neužívá se  ||  značí **střední pauzu**:\\ //no jo .. a co je eště novýho//  |  neužívá se  ||  značí **střední pauzu**:\\ //no jo .. a co je eště novýho//  |