AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:ksk-dopisy [2013/11/27 15:26] jankocekcnk:ksk-dopisy [2013/12/05 04:19] olgarichterova
Řádek 1: Řádek 1:
 ====== Korpus soukromé korespondence ====== ====== Korpus soukromé korespondence ======
  
 +**Korpus soukromé korespondence** (KSK-dopisy) umožňuje nahlédnout do jazyka a stylu [[pojmy:synchronni|současných]] epistolárních textů soukromého charakteru. Jde o korpus zachycující možná v posledním existenčním stadiu tradiční ručně psanou korespondenci.
  
-Korpus soukromé korespondence (KSK-dopisy) přináší nahlédnutí do jazyka stylu současných epistolárních textů soukromého charakteru.+^ <fs medium>Název</fs> ^ <fs medium>[[cnk:ksk-dopisy|KSK-dopisy]]</fs>
 +^ Počet dopisů |   2000 |   
 +^ Počet [[pojmy:token|pozic (tokenů)]] |   942 573 |  
 +^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce dalších značek |  764 918 |  
 +^ Počet [[pojmy:word| slovních tvarů (wordů)]] |  76 587  |   
 +^ Roky napsání |   1990--2004 | 
  
-KSK-dopisy, zachycující možná v posledním existenčním stadiu tradiční ručně psanou korespondenci, obsahuje elektronické přepisy 2000 dopisů (tj. 942 573 pozic) z let 1990-2004. Výběr textů zachovává podmínku různosti idiolektů, tj. reprezentuje jazyk 2000 různých pisatelů. V shromážděné korespondenci jsou zastoupeni pisatelé z celé České republikyvšech věkových a vzdělanostních kategorií, akcentována je však zejména komunikace mladých lidí, která nejlépe dokládá současné vývojové tendence češtiny, proměny korespondenčního žánru i psaného projevu vůbec.+Výběr textů zachovává podmínku různosti idiolektů, tj. reprezentuje jazyk dvou tisíc různých pisatelů z celé České republiky všech věkových a vzdělanostních kategorií, akcentována je však zejména komunikace mladých lidí, která nejlépe dokládá současné vývojové tendence češtiny, proměny korespondenčního žánru i psaného projevu vůbec.
  
-Všechny shromážděné korespondenční texty jsou opatřeny základními sociologickými charakteristikami pisatelů a adresátů, konkrétně informacemi o jejich pohlaví (žena – muž), věku (4 věkové stupně) a vzdělání (2 stupně). V jmenovaných parametrech je v zásadě dodržena kompatibilita se zpracováním jazykového materiálu v korpusech mluvené češtiny (PMK, BMK), které jsou rovněž součástí Českého národního korpusu. Novum představuje reflexe teritoriálního nářečního zázemí pisatelů dopisů. To je zachyceno prostřednictvím lokalizačních údajů a číselné značky, která zařazuje lokalitu do nářečních oblastí určených podle Českého jazykového atlasu (1993). U každého dokumentu je dále připojena charakteristika vztahu mezi pisatelem a adresátem (4 možnosti) a informace o roku napsání dopisu a jeho formě. Vyhledávací program Bonito (© P. Rychlý) umožňuje zobrazení hodnot uvedených doprovodných charakteristik u všech slovních výskytů. K postupu shromažďování soukromé korespondence pro KSK-dopisy a principům přepisu epistolárních textů viz  Sběr a přepis dopisů.+Všechny shromážděné korespondenční texty jsou opatřeny základními sociologickými charakteristikami pisatelů a adresátů, konkrétně informacemi o jejich pohlaví (žena –muž), věku (4 věkové stupně) a vzdělání (2 stupně). V jmenovaných parametrech je v zásadě dodržena kompatibilita se zpracováním jazykového materiálu v korpusech mluvené češtiny ([[cnk:pmk|PMK]][[cnk:bmk|BMK]]), které jsou rovněž součástí Českého národního korpusu. Novum v době vzniku edstavovala reflexe teritoriálního nářečního zázemí pisatelů dopisů. To je zachyceno prostřednictvím lokalizačních údajů a číselné značky, která zařazuje lokalitu do nářečních oblastí určených podle Českého jazykového atlasu (1993). U každého dokumentu je dále připojena charakteristika vztahu mezi pisatelem a adresátem (4 možnosti) a informace o roku napsání dopisu a jeho formě. K postupu shromažďování soukromé korespondence pro KSK-dopisy a principům přepisu epistolárních textů viz  FIXME[[http://korpus.cz/sber_a_prepis.php|Sběr a přepis dopisů]].
  
 Soukromá korespondence je pro lingvistiku jedinečným zdrojem poznání jazykového úzu. K jejím přednostem patří značná autenticita, neformálnost a spontánnost projevu (v tomto smyslu jsou se soukromými dopisy srovnatelné snad jen tajně pořízené nahrávky běžné mluvy), dále teritoriální a sociální pestrost pisatelů (umožňující studium územně a sociálně vázaných jazykových jevů, aniž by bylo nutno provádět náročný terénní výzkum) a především oscilace mezi mluveností a psaností (poskytující mj. zajímavé informace o relaci spisovnost-nespisovnost). Soukromá korespondence je pro lingvistiku jedinečným zdrojem poznání jazykového úzu. K jejím přednostem patří značná autenticita, neformálnost a spontánnost projevu (v tomto smyslu jsou se soukromými dopisy srovnatelné snad jen tajně pořízené nahrávky běžné mluvy), dále teritoriální a sociální pestrost pisatelů (umožňující studium územně a sociálně vázaných jazykových jevů, aniž by bylo nutno provádět náročný terénní výzkum) a především oscilace mezi mluveností a psaností (poskytující mj. zajímavé informace o relaci spisovnost-nespisovnost).
Řádek 14: Řádek 20:
 KSK-dopisy byl vytvořen v Ústavu českého jazyka na  Filozofické fakultě Masarykovy univerzity v Brně pod vedením Z. Hladké. Na sběru a zpracování  materiálu se podílela řada studentů FF MU. Pod  manažer Bonito uložil korpus   Pavel Rychlý z Fakulty informatiky MU. KSK-dopisy byl vytvořen v Ústavu českého jazyka na  Filozofické fakultě Masarykovy univerzity v Brně pod vedením Z. Hladké. Na sběru a zpracování  materiálu se podílela řada studentů FF MU. Pod  manažer Bonito uložil korpus   Pavel Rychlý z Fakulty informatiky MU.
  
-Poznámka 1: +**Poznámka 1**: Dopisy shromážděné v KSK-dopisy byly získány od přímých účastníků korespondenčního styku (adresátů, případně i pisatelů), kteří explicitně souhlasili s jejich zveřejněním a využitím pro nekomerční studijní účely. Způsob zpracování zachovává anonymitu pisatelů, adresátů i dárců a eliminuje identifikační údaje uvedené v originálech textů (příjmení, adresy, telefonní čísla apod.).
-Dopisy shromážděné v KSK-dopisy byly získány od přímých účastníků korespondenčního styku (adresátů, případně i pisatelů), kteří explicitně souhlasili s jejich zveřejněním a využitím pro nekomerční studijní účely. Způsob zpracování zachovává anonymitu pisatelů, adresátů i dárců a eliminuje identifikační údaje uvedené v originálech textů (příjmení, adresy, telefonní čísla apod.).+
  
-Poznámka 2: +**Poznámka 2**: KSK-dopisy byl vytvořen v rámci projektu GA ČR 405/03/0248, jehož cílem projektu bylo připravit veřejně přístupný referenční zdroj pro studium současné soukromé korespondence a naznačit možnosti lingvistického využití epistolárních textů. K výstupům projektu patří kromě KSK-dopisy tištěná publikace a dvě CD **Zdeňka Hladká a kol.: Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS. Brno: Masarykova univerzita 2005**. Na CD je vedle ručně psaných dopisů zahrnutých paralelně do KSK-dopisy zpracováno ještě 1000 e-mailů a cca 2000 SMS. Připojeny jsou také fotokopie všech 2000 ručně psaných dopisů, vzorek gramaticky označkovaného korpusu (v rozsahu 1000 dopisů), statistické přehledy apod. Tištěná část publikace přináší detailní informace o metodice sběru a zpracování korespondenčních textů a zároveň na konkrétních příkladech naznačuje směry možného lingvistického využití korespondenčního materiálu. Práce vyšla jako neprodejná, v značně omezeném počtu kusů. Distribuci zajišťuje pouze garant projektu (e-mail: zdena@phil.muni.cz). 
-KSK-dopisy byl vytvořen v rámci projektu GA ČR 405/03/0248, jehož cílem projektu bylo připravit veřejně přístupný referenční zdroj pro studium současné soukromé korespondence a naznačit možnosti lingvistického využití epistolárních textů. K výstupům projektu patří kromě KSK-dopisy tištěná publikace a dvě CD **Zdeňka Hladká a kol.: Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS. Brno: Masarykova univerzita 2005**. Na CD je vedle ručně psaných dopisů zahrnutých paralelně do KSK-dopisy zpracováno ještě 1000 e-mailů a cca 2000 SMS. Připojeny jsou také fotokopie všech 2000 ručně psaných dopisů, vzorek gramaticky označkovaného korpusu (v rozsahu 1000 dopisů), statistické přehledy apod. Tištěná část publikace přináší detailní informace o metodice sběru a zpracování korespondenčních textů a zároveň na konkrétních příkladech naznačuje směry možného lingvistického využití korespondenčního materiálu. Práce vyšla jako neprodejná, v značně omezeném počtu kusů. Distribuci zajišťuje pouze garant projektu (e-mail: zdena@phil.muni.cz). +
  
- --- //Zdeňka Hladká// garant KSK-dopisy 
  
-Odkazy: +===== Jak citovat ORAL2006 ===== 
-Doprovodné chrakteristiky v KSK +<WRAP round tip 30%> 
-Sběr a epis dopisů +Hladká, Z.: KSK-dopisy (Korpus soukromé korespondence): episy ručně psaných dopisů z let 1990–-2004. Ústav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: <http://www.korpus.cz>
-Dělení nářečních oblastí v Českém jazykovém atlasu (mapa)+</WRAP>
  
 +
 +
 + --- //Zdeňka Hladká, garant KSK-dopisy//
 +
 +===== Související odkazy =====
 +<WRAP round box 49%>
 +[[seznamy:pravidlaprepis|Pravidla pro přepis nahrávek]], [[cnk:oral2008|ORAL2008]], [[cnk:pmk|PMK]], [[cnk:bmk|BMK]], [[pojmy:mluveny|Korpus mluveného jazyka]], FIXME dle http://korpus.cz/dopisy.php [[Doprovodné chrakteristiky v KSK, Sběr a přepis dopisů, Dělení nářečních oblastí v Českém jazykovém atlasu (mapa)]]
 +</WRAP>