Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:oral:pravidla [2017/05/31 15:00] – [Interpunkční značky v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL)] petrapoukarova | cnk:oral:pravidla [2017/06/01 11:20] (aktuální) – [Transkripce jazykových jevů] petrapoukarova |
---|
====== Transkripce v korpusu ORAL ====== | ====== Transkripce v korpusu ORAL ====== |
Korpus ORAL sdružuje tři již publikované korpusy ([[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]], [[cnk:oral2013|ORAL2013]]) a k nim přibyvší data označená jako Z-ORAL. Pravidla pro transkripci se postupem času měnila, bylo proto nutné data sjednotit a upravit. | Korpus [[cnk:oral|ORAL]] sdružuje tři již publikované korpusy ([[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]], [[cnk:oral2013|ORAL2013]]) a k nim přibyvší data označená jako ORAL-Z. Pravidla pro transkripci se postupem času měnila, bylo proto nutné data sjednotit a [[cnk:oral#vytvoreni_korpusu_oral|upravit]]. Tato stránka shrnuje proměny transkripce napříč všemi třemi korpusy řady ORAL a sjednoceným korpusem ORAL. |
| |
===== Transkripce jazykových jevů v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL) ===== | ===== Transkripce jazykových jevů ===== |
^ Pojmenování jevu ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ^ | ^ Pojmenování jevu ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ^ |
| **ustálená zjednodušená výslovnost** | <fc #ff0000>//pudu, vemu, výde, pocem, dyž, neska, ňák, ďáli, štyry/štyři/čtyry/čtyři, pošta/počta, myslím/myslim/mysim//</fc>((Toto není ani zdaleka vyčerpávající výčet; zejména pokud hledáte frekventovaná/výplňková slova (//protože//, //vlastně// atp.), důrazně doporučujeme nahlédnout do pravidel pro přepis korpusů [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a {{:cnk:prepisovaci_pravidla_oral2013.pdf|ORAL2013}}, zda se v nich nepočítá s různými variantami.)) |||| | | **ustálená zjednodušená výslovnost** | <fc #ff0000>//pudu, vemu, výde, pocem, dyž, neska, ňák, ďáli, štyry/štyři/čtyry/čtyři, pošta/počta, myslím/myslim/mysim//</fc>((Toto není ani zdaleka vyčerpávající výčet; zejména pokud hledáte frekventovaná/výplňková slova (//protože//, //vlastně// atp.), důrazně doporučujeme nahlédnout do pravidel pro přepis korpusů [[cnk:oral2006|ORAL2006]], [[cnk:oral2008|ORAL2008]] a {{:cnk:prepisovaci_pravidla_oral2013.pdf|ORAL2013}}, zda se v nich nepočítá s různými variantami.)) |||| |
| - **před R L M N Ň J** | dle pravopisu:\\ //s máslem// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme, kvůli/gvůli// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //s máslem// i //z máslem//, //kupme// i //kubme//</fc> | | | - **před R L M N Ň J** | dle pravopisu:\\ //s máslem// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme// | dle výslovnosti:\\ //s máslem/z máslem, kupme/kubme, kvůli/gvůli// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //s máslem// i //z máslem//, //kupme// i //kubme//</fc> | |
| - **skupina sh-** | dle pravopisu:\\ //shoda// | dle výslovnosti:\\ //schoda/zhoda// || <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //schoda// i //zhoda//</fc> | | | - **skupina sh-** | dle pravopisu:\\ //shoda// | dle výslovnosti:\\ //schoda/zhoda// || <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //schoda// i //zhoda//</fc> | |
| **asimilace místa tvoření** | dle pravopisu:\\ //rozčesat, sčítat// || dle výslovnosti:\\ //roščesat//((S výjimkou asimilace místa tvoření zachováváme předponu roz-, viz výše)), //ščítat// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //rozčesat// i //roščesat//</fc> | | | **asimilace místa tvoření** | dle pravopisu:\\ //rozčesat, sčítat// || dle výslovnosti:\\ //roščesat//((S výjimkou asimilace místa tvoření zachováváme předponu roz-, viz výše.)), //ščítat// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //rozčesat// i //roščesat//</fc> | |
| **hranice slov** | <fc #ff0000>respektují se:\\ //pod čepicí// (**NE** //počepicí//), //to jo, no no//</fc> |||| | | **hranice slov** | <fc #ff0000>respektují se:\\ //pod čepicí// (**NE** //počepicí//), //to jo, no no//</fc> |||| |
| **kvantita** | <fc #ff0000>zachycuje se **krácení** v koncovkách i základech slov:\\ //rohlik, vim, žensky (=ženský)//</fc> |||| | | **kvantita** | <fc #ff0000>zachycuje se **krácení** v koncovkách i základech slov:\\ //rohlik, vim, žensky (=ženský)//</fc> |||| |
| ::: | <fc #ff0000>zachycuje se **dloužení** v koncovkách i základech slov, vč. emfatického dloužení:\\ //klucí, volál, sebú, bóže//</fc> |||| | | ::: | <fc #ff0000>zachycuje se **dloužení** v koncovkách i základech slov, vč. emfatického dloužení:\\ //klucí, volál, sebú, bóže//</fc> |||| |
| **komparativ a superlativ** | dle pravopisu:\\ //novější, pěknější, vlasatější// || moravské realizace s dlouhým **ě** zapisujeme jako kombinaci **j** + **é**:\\ //novjéši, pěkňéši, vlasaťéši// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //novější// i //novjéši//, //pěknější// i //pěkňéši//</fc> | | | **komparativ a superlativ** | dle pravopisu:\\ //novější, pěknější, vlasatější// || moravské realizace s dlouhým **ě** zapisujeme jako kombinaci **j** + **é**:\\ //novjéši, pěkňéši, vlasaťéši// | <fc #ff0000>zápis zůstává stejný jako v jednotlivých korpusech:\\ //novější// i //novjéši//, //pěknější// i //pěkňéši//</fc> | |
| **zkratky** | dle výslovnosti: pokud jako jedno slovo, píše se jako jedno slovo; pokud zvlášť, píše se zvlášť:\\ //dé vé dé/dý ví dý/dývídýčko, aids, ú es á// |||| | | **zkratky** | dle výslovnosti: pokud jako jedno slovo, píše se jako jedno slovo; pokud zvlášť, píše se zvlášť:\\ //dé vé dé/dý ví dý/dývídýčko, aids, ú es á// ||| <fc #ff0000>byla-li zkratka zapsána odděleně (//ú es á//), bylo z ní vytvořeno jedno slovo (//úesá//)</fc> | |
| **neznámá X** | zápis //iks//:\\ //po iks letech// |||| | | **neznámá X** | <fc #ff0000>zápis //iks//:\\ //po iks letech//</fc> |||| |
| **velká písmena** | <fc #ff0000>u vlastních jmen dle pravopisu</fc> |||| | | **velká písmena** | <fc #ff0000>u vlastních jmen dle pravopisu</fc> |||| |
| **cizí slova** | <fc #ff0000>dle pravopisu:\\ //software//</fc> |||| | | **cizí slova** | <fc #ff0000>dle pravopisu:\\ //software//</fc> |||| |
| **hezitace** | zvuky spíše souhláskové se zapisují:\\ //hmm//((Vždy pouze 3 písmena.)) || zvuky spíše souhláskové se zapisují:\\ //mmm// | <fc #ff0000>hlásková povaha hezitačních zvuků\\ se nerozlišuje, původní způsob zápisu\\ nahrazen symbolem //@//</fc> | | | **hezitace** | zvuky spíše souhláskové se zapisují:\\ //hmm//((Vždy pouze 3 písmena.)) || zvuky spíše souhláskové se zapisují:\\ //mmm// | <fc #ff0000>hlásková povaha hezitačních zvuků\\ se nerozlišuje, původní způsob zápisu\\ nahrazen symbolem //@//</fc> | |
| ::: | zvuky spíše samohláskové se zapisují:\\ //eee// ||| ::: | | | ::: | zvuky spíše samohláskové se zapisují:\\ //eee// ||| ::: | |
| **responzní zvuky** | viz **hezitace** || spíše přitakávací zvuky:\\ //hmm// || | | **responzní zvuky** | viz **hezitace** || <fc #ff0000>spíše přitakávací zvuky:\\ //hmm//</fc> || |
| ::: | viz **hezitace** || spíše nesouhlasné, odporovací zvuky:\\ //emm// || | | ::: | viz **hezitace** || <fc #ff0000>spíše nesouhlasné, odporovací zvuky:\\ //emm//</fc> || |
| **verbalizovaný smích** | zápis dle slyšeného:\\ //haha/ha ha, chichi/chi chi// |||| | | **verbalizovaný smích** | <fc #ff0000>zápis dle slyšeného:\\ //haha/ha ha, chichi/chi chi//</fc> |||| |
| |
===== Znaky a symboly použité v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL) ===== | ===== Znaky a symboly ===== |
^ Jev ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ ORAL ^ | ^ Jev ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ^ |
| **nedořečené, neúplné slovo** | značí se hvězdičkou ''*'':\\ //koč*, *ková nekázeň// |||| | | **nedořečené, neúplné slovo** | <fc #ff0000>značí se hvězdičkou ''*'':\\ //koč* *ková nekázeň//</fc> |||| |
| | pokud za nedořečeným slovem následuje totéž slovo dořečené, **neoddělují** se čárkou:\\ //koč* kočka// |||| | | | pokud za nedořečeným slovem následuje jiné slovo, **oddělují** se čárkou:\\ //přijde zít*, pozítří// || <fc #ff0000>**neoddělují** se:\\ //přijde zít* pozítří//</fc> || |
| | pokud za nedořečeným slovem následuje jiné slovo, **oddělují** se čárkou:\\ //přijde zít*, pozítří// || **neoddělují** se:\\ //přijde zít* pozítří// || | | **příklonné s** | neznačí se || značí se ''*s'':\\ //dělala *s// | <fc #ff0000>značí se ''#s'':\\ //dělala #s//</fc> | |
| **příklonné s** | neznačí se || značí se ''*s'':\\ //dělala *s// | značí se ''#s'':\\ //dělala #s// | | | **spojovací výraz -li** | psáno se spojovníkem ''-li'' a odsazeno od předchozího slova: \\ //dělala -li// ||| <fc #ff0000>psáno s křížkem ''#li'' a odsazeno od předchozího slova:\\ //dělala #li//</fc> | |
| **spojovací výraz -li** | psáno se spojovníkem ''-li'' a odsazeno od předchozího slova: \\ //dělala -li// ||| psáno s křížkem ''#li'' a odsazeno od předchozího slova:\\ //dělala #li// | | | **typ //proň, naň//** | zapisuje se jako jedno slovo:\\ //proň//, //naň// ||| <fc #ff0000>na slovním švu se vyděluje za pomoci **křížku** ''#'' předložka a redukovaná forma zájmena:\\ //pro #ň//, //za #ň//</fc> | |
| **typ //proň, naň//** | zapisuje se jako jedno slovo:\\ //proň//, //naň// ||| na slovním švu se vyděluje za pomoci **křížku** ''#'' předložka a redukovaná forma zájmena:\\ //pro #ň//, //za #ň// | | | **nesrozumitelný úsek** | značí se %%---%% ||| <fc #ff0000>značí se **kulatými závorkami**, nesrozumitelné úseky zapisovány jako komentář:\\ ''(nesrozumitelné)''</fc> | |
| **nesrozumitelný úsek** | značí se %%---%% ||| značí se **kulatými závorkami**, nesrozumitelné úseky zapisovány jako komentář:\\ ''(nesrozumitelné)'' | | | **neukončené promluvy** | značí se ''...:''\\ //mysim že budu mít co dělat abych ...:// ||| <fc #ff0000>značí se pomocí **minus** ''-'':\\ //mysim že budu mít co dělat abych -//</fc> | |
| **neukončené promluvy** | značí se ''...:''\\ //mysim že budu mít co dělat abych ...:// ||| značí se pomocí **minus** ''-'':\\ //mysim že budu mít co dělat abych -// | | | **přerušení promluvy** | značí se ... na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš ...//\\ mluvčí 2: //no//\\ mluvčí 1: //... přejedeš řeku// ||| <fc #ff0000>značí se pomocí **plus** ''+'' na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš +//\\ mluvčí 2: //no//\\ mluvčí 1: //+ přejedeš řeku//</fc> | |
| **přerušení promluvy** | značí se ... na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš ...//\\ mluvčí 2: //no//\\ mluvčí 1: //... přejedeš řeku// ||| značí se pomocí **+** na začátku i konci přerušené promluvy:\\ mluvčí 1: //sjedeš z toho kopce přejedeš +//\\ mluvčí 2: //no//\\ mluvčí 1: //+ přejedeš řeku// | | | **poznámka, vysvětlivka v přepisu** | <fc #ff0000>zapisuje se do kulatých závorek ''()'':\\ //(smích) (cizojazyčný projev) (citoslovce) (odmlčení)//</fc>((Tj. výrazně dlouhá pauza.)) |||| |
| **poznámka, vysvětlivka v přepisu** | zapisuje se do kulatých závorek ''()'':\\ //(smích) (cizojazyčný projev) (citoslovce) (odmlčení)//((Tj. výrazně dlouhá pauza.)) |||| | |
| |
===== Interpunkční značky v korpusu ORAL (ve srovnání s předchozími korpusy řady ORAL) ===== | ===== Interpunkční značky ===== |
| ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ ORAL ||| | | ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 ^ <fc #ff0000>ORAL </fc> ||| |
| ||| ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 + Z-ORAL | | | | | | ^ ORAL2006 ^ ORAL2008 ^ ORAL2013 + Z-ORAL | |
| **typ interpunkce** | větná((dle psaného jazyka.)) || pauzová((Je nezávislá na psaném jazyce, značí se v ní realizované pauzy.)) | čárka se užívá v místě předpokládaného konce věty (místo tečky) || pauzová | | | **typ interpunkce** | větná((Dle psaného jazyka.)) || pauzová((Je nezávislá na psaném jazyce, značí se v ní realizované pauzy.)) | čárka se užívá v místě předpokládaného konce věty (místo tečky) || pauzová | |
| **tečka (.)** | označuje konec promluvy || tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim// | neužívá se || tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim// | | | **tečka (.)** | označuje konec promluvy || tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim// | neužívá se || tečka (.) značí **kratší** pauzu:\\ //sem mu řek že . nevim// | |
| **dvě tečky (..)** | neužívá se || značí **střední pauzu**:\\ //no jo .. a co je eště novýho// | neužívá se || značí **střední pauzu**:\\ //no jo .. a co je eště novýho// | | | **dvě tečky (..)** | neužívá se || značí **střední pauzu**:\\ //no jo .. a co je eště novýho// | neužívá se || značí **střední pauzu**:\\ //no jo .. a co je eště novýho// | |