Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
seznamy:pravidla_ksk [2013/12/19 11:11] – [Pravidla pro přepis dopisů] vaclavcvrcek | seznamy:pravidla_ksk [2017/04/21 09:09] (aktuální) – [Pravidla pro přepis dopisů] michalskrabal |
---|
====== Sběr a přepis dopisů ====== | ====== Sběr a přepis dopisů ====== |
| |
**Sběr** soukromé korespondence probíhal v ÚČJ FF MU **od konce 90. let 20. století**. V současné době **archiv** shromážděných textů obsahuje zhruba **3000** elektronických přepisů **ručně psaných dopisů**, **1500 e-mailů** a cca **2500 SMS**. | **Sběr** soukromé korespondence probíhal v [[http://www.phil.muni.cz/wucj/|ÚČJ FF MU]] **od konce 90. let 20. století**. V současné době **archiv** shromážděných textů obsahuje zhruba **3000** elektronických přepisů **ručně psaných dopisů**, **1500 e-mailů** a cca **2500 SMS**. |
| |
Legislativní (i morální) problém se zveřejněním soukromé korespondence byl po konzultaci s právním poradcem řešen tím, že dopisy byly získávány přímo od adresátů, tedy se svolením alespoň jednoho účastníka komunikace. (Svolení pisatelů by při tak velkém množství textů nebylo možné zajistit.) Dárci korespondence souhlasili s jejím zveřejněním a užitím pro nekomerční studijní účely. Navíc z odevzdávaných textů vyškrtali všechny identifikační údaje. Pokud to neudělali důsledně, byly tyto informace eliminovány ve fázi přepisu a archivace dopisu. | Legislativní (i morální) problém se zveřejněním soukromé korespondence byl po konzultaci s právním poradcem řešen tím, že dopisy byly získávány přímo od adresátů, tedy se svolením alespoň jednoho účastníka komunikace. (Svolení pisatelů by při tak velkém množství textů nebylo možné zajistit.) Dárci korespondence souhlasili s jejím zveřejněním a užitím pro nekomerční studijní účely. Navíc z odevzdávaných textů vyškrtali všechny identifikační údaje. Pokud to neudělali důsledně, byly tyto informace eliminovány ve fázi přepisu a archivace dopisu. |
Při přepisu do elektronické podoby byla striktně dodržována původní podoba textů (včetně pravopisných chyb, překlepů apod.). Pouze identifikační údaje (příjmení, adresy, telefonní čísla apod.) byly nahrazovány sjednocujícím znakem @ a složenou závorkou s obecnou charakteristiku. Např.: {následuje telefonní číslo} @. | Při přepisu do elektronické podoby byla striktně dodržována původní podoba textů (včetně pravopisných chyb, překlepů apod.). Pouze identifikační údaje (příjmení, adresy, telefonní čísla apod.) byly nahrazovány sjednocujícím znakem @ a složenou závorkou s obecnou charakteristiku. Např.: {následuje telefonní číslo} @. |
| |
Text byl přepisován kontinuálně, pouze začátek a konec dopisu byl označován znakem ## a začátek odstavce znakem # (v [[cnk:ksk-dopisy|KSK]] nahrazeno [[pojmy:atributy_strukturni|strukturními značkami]] ''<doc>'', ''<p>''). Jako odstavec byly značeny i samostatné řádky v nadpisových a ukončovacích částech dopisu; začátek jednotlivých stránek se označoval jako odstavec, pokud tomu odpovídalo obsahové členění textu. Interpunkční znaménka se oddělovala mezerami po obou stranách (kromě případů řetězení interpunkčních znaků, které se od sebe neoddělovaly), pouze tečky za zkratkami byly ponechány bez mezer. Nečitelný text byl nahrazován třemi pomlčkami <nowiki>---</nowiki> a do složených závorek se uvedl počet nečitelných slov. Např.:{následují 4 nečitelná slova} <nowiki>---</nowiki>. Do složených závorek se zapisovaly také jiné komentáře přepisovatele, např. upozornění na typ písma (v přepisu nebyly typy písma rozlišovány), na připojený obrázek apod. Např.: {následující tři slova psána kurzivou}. | Text byl přepisován kontinuálně, pouze začátek a konec dopisu byl označován znakem ## a začátek odstavce znakem # (v [[cnk:ksk-dopisy|KSK]] nahrazeno [[pojmy:atributy_strukturni|strukturními značkami]] ''<doc>'', ''<p>''). Jako odstavec byly značeny i samostatné řádky v nadpisových a ukončovacích částech dopisu; začátek jednotlivých stránek se označoval jako odstavec, pokud tomu odpovídalo obsahové členění textu. Interpunkční znaménka se oddělovala mezerami po obou stranách (kromě případů řetězení interpunkčních znaků, které se od sebe neoddělovaly), pouze tečky za zkratkami byly ponechány bez mezer. Nečitelný text byl nahrazován třemi pomlčkami <nowiki>---</nowiki> a do složených závorek se uvedl počet nečitelných slov. Např.: {následují 4 nečitelná slova} <nowiki>---</nowiki>. Do složených závorek se zapisovaly také jiné komentáře přepisovatele, např. upozornění na typ písma (v přepisu nebyly typy písma rozlišovány), na připojený obrázek apod. Např.: {následující tři slova psána kurzivou}. |
| |
Složenými závorkami byly označeny také citátové pasáže v rozsahu věty a více. Jsou v KSK sice odhalitelné, ale nepodléhají běžnému vyhledávání ani statistickým analýzám, aby nezkreslovaly autentický obraz jazyka soukromé korespondence. Podobně jsou v KSK zachyceny také cizojazyčné pasáže v rozsahu věty a více. Se všemi texty v složených závorkách korpusový manažer pracuje pod značkami "note" a "note text" (viz menu [[manual:menu:moznosti_zobrazeni#atributy_struktury_a_metainformace|Možnosti zobrazení > Atributy, struktury a metainformace]] | Složenými závorkami byly označeny také citátové pasáže v rozsahu věty a více. Jsou v KSK sice odhalitelné, ale nepodléhají běžnému vyhledávání ani statistickým analýzám, aby nezkreslovaly autentický obraz jazyka soukromé korespondence. Podobně jsou v KSK zachyceny také cizojazyčné pasáže v rozsahu věty a více. Se všemi texty v složených závorkách korpusový manažer pracuje pod značkami "note" a "note text" (viz menu [[manualy:kontext:moznosti_zobrazeni#atributy_struktury_a_metainformace|Zobrazení → Korpusová nastavení]]). |