Následující verze | Předchozí verze |
cnk:ksk-dopisy [2013/06/20 20:35] – vytvořeno olgarichterova | cnk:ksk-dopisy [2023/02/22 14:16] (aktuální) – [Jak citovat KSK-dopisy] michalkren |
---|
====== Korpus soukromé korespondence ====== | ====== Korpus soukromé korespondence ====== |
| |
| **Korpus soukromé korespondence** (KSK-dopisy) umožňuje nahlédnout do jazyka a stylu [[pojmy:synchronni|současných]] epistolárních textů soukromého charakteru. Jde o korpus zachycující možná v posledním existenčním stadiu tradiční ručně psanou korespondenci. |
| |
Korpus soukromé korespondence (KSK) přináší nahlédnutí do jazyka a stylu současných epistolárních textů soukromého charakteru. | ^ <fs medium>Název korpusu</fs> ^ <fs medium>[[cnk:ksk-dopisy|KSK-dopisy]]</fs> | |
| ^ Počet dopisů | 2000 | |
| ^ Počet [[pojmy:token|pozic (tokenů)]] | 942 573 | |
| ^ Počet [[pojmy:token|pozic (tokenů)]] bez interpunkce a dalších značek | 764 918 | |
| ^ Počet [[pojmy:word| slovních tvarů (wordů)]] | 76 587 | |
| ^ Roky napsání | 1990--2004 | |
| |
KSK, zachycující možná v posledním existenčním stadiu tradiční ručně psanou korespondenci, obsahuje elektronické přepisy 2000 dopisů (tj. 942 573 pozic) z let 1990-2004. Výběr textů zachovává podmínku různosti idiolektů, tj. reprezentuje jazyk 2000 různých pisatelů. V shromážděné korespondenci jsou zastoupeni pisatelé z celé České republiky, všech věkových a vzdělanostních kategorií, akcentována je však zejména komunikace mladých lidí, která nejlépe dokládá současné vývojové tendence češtiny, proměny korespondenčního žánru i psaného projevu vůbec. | Výběr textů zachovává podmínku různosti idiolektů, tj. reprezentuje jazyk dvou tisíc různých pisatelů z celé České republiky patřících do všech věkových a vzdělanostních kategorií, akcentována je však zejména komunikace mladých lidí, která nejlépe dokládá současné vývojové tendence češtiny, proměny korespondenčního žánru i psaného projevu vůbec. |
| |
Všechny shromážděné korespondenční texty jsou opatřeny základními sociologickými charakteristikami pisatelů a adresátů, konkrétně informacemi o jejich pohlaví (žena – muž), věku (4 věkové stupně) a vzdělání (2 stupně). V jmenovaných parametrech je v zásadě dodržena kompatibilita se zpracováním jazykového materiálu v korpusech mluvené češtiny (PMK, BMK), které jsou rovněž součástí Českého národního korpusu. Novum představuje reflexe teritoriálního nářečního zázemí pisatelů dopisů. To je zachyceno prostřednictvím lokalizačních údajů a číselné značky, která zařazuje lokalitu do nářečních oblastí určených podle Českého jazykového atlasu (1993). U každého dokumentu je dále připojena charakteristika vztahu mezi pisatelem a adresátem (4 možnosti) a informace o roku napsání dopisu a jeho formě. Vyhledávací program Bonito umožňuje zobrazení hodnot uvedených doprovodných charakteristik u všech slovních výskytů. K postupu shromažďování soukromé korespondence pro KSK a principům přepisu epistolárních textů viz Sběr a přepis dopisů. | ===== Dostupné metainformace ===== |
| Všechny shromážděné korespondenční texty jsou opatřeny základními sociologickými charakteristikami pisatelů a adresátů, konkrétně informacemi o jejich pohlaví (žena –- muž), věku (4 věkové stupně) a vzdělání (2 stupně). V jmenovaných parametrech je v zásadě dodržena kompatibilita se zpracováním jazykového materiálu v korpusech mluvené češtiny ([[cnk:pmk|PMK]], [[cnk:bmk|BMK]]), které jsou rovněž součástí Českého národního korpusu. Novum v době vzniku představovala reflexe teritoriálního nářečního zázemí pisatelů dopisů. To je zachyceno prostřednictvím lokalizačních údajů a číselné značky, která zařazuje lokalitu do nářečních oblastí určených podle Českého jazykového atlasu (1993). U každého dokumentu je dále připojena charakteristika vztahu mezi pisatelem a adresátem (4 možnosti) a informace o roku napsání dopisu a jeho formě. K postupu shromažďování soukromé korespondence pro KSK-dopisy a principům přepisu epistolárních textů viz [[cnk:ksk-prepis|Sběr a přepis dopisů]]. |
| |
Soukromá korespondence je pro lingvistiku jedinečným zdrojem poznání jazykového úzu. K jejím přednostem patří značná autenticita, neformálnost a spontánnost projevu (v tomto smyslu jsou se soukromými dopisy srovnatelné snad jen tajně pořízené nahrávky běžné mluvy), dále teritoriální a sociální pestrost pisatelů (umožňující studium územně a sociálně vázaných jazykových jevů, aniž by bylo nutno provádět náročný terénní výzkum) a především oscilace mezi mluveností a psaností (poskytující mj. zajímavé informace o relaci spisovnost-nespisovnost). | ===== Dopisy a mluvený jazyk ===== |
| |
Epistolární texty mohou sloužit např. jako východisko pro výzkum teritoriálního a funkčního šíření/nešíření obecné češtiny, mají značnou hodnotu pro lexikologii a lexikografii (zachycují např. řadu frekventovaných lexikálních jednotek běžné mluvy a slangů, které nebyly dosud uvedeny v slovnících češtiny, informují o neologismech, o procesu adaptace přejímaných slov), poskytují studijní materiál stylistice (žánr soukromého dopisu je stále velmi málo prozkoumán), pragmalingvistice (pozornost si zaslouží např. genderové diference), textové lingvistice ad. Soukromé dopisy mohou být zajímavým materiálovým zdrojem i pro nelingvistické disciplíny, např. pro sociologii a psychologii. Velké uplatnění mohou nalézt také ve výuce češtiny, a to nejen na českých školách, ale i ve výuce češtiny pro cizince. Citovostí, kreativitou a často i humorem soukromá korespondence určitě zaujme a potěší i laické čtenáře. | Soukromá korespondence je pro lingvistiku jedinečným zdrojem poznání jazykového úzu. K jejím přednostem patří značná autenticita, neformálnost a spontánnost projevu (v tomto smyslu jsou se soukromými dopisy srovnatelné snad jen tajně pořízené nahrávky běžné mluvy), dále teritoriální a sociální pestrost pisatelů (umožňující studium územně a sociálně vázaných jazykových jevů, aniž by bylo nutno provádět náročný terénní výzkum) a především oscilace mezi [[pojmy:mluveny|mluveností]] a psaností (poskytující mj. zajímavé informace o relaci spisovnost -- nespisovnost). |
| |
Poznámka 1: | ===== Dopisy a funkční stratifikace ===== |
Dopisy shromážděné v KSK byly získány od přímých účastníků korespondenčního styku (adresátů, případně i pisatelů), kteří explicitně souhlasili s jejich zveřejněním a využitím pro nekomerční studijní účely. Způsob zpracování zachovává anonymitu pisatelů, adresátů i dárců a eliminuje identifikační údaje uvedené v originálech textů (příjmení, adresy, telefonní čísla apod.). | Epistolární texty mohou sloužit např. jako východisko pro výzkum teritoriální a funkční stratifikace češtiny, mají značnou hodnotu pro lexikologii a lexikografii (ve vysoké koncentraci a na pestré škále zachycují příznakové lexikum od knižních lexémů přes nespisovná slova běžné mluvy a emocionální výrazivo až ke kreativním okazionalismům), poskytují studijní materiál stylistice (epistolární styl i žánr soukromého dopisu patří stále k málo prozkoumaným), pragmalingvistice, genderově orientované lingvistice ad. Soukromé dopisy mohou být zajímavým materiálovým zdrojem i pro nelingvistické disciplíny, např. pro historii, sociologii a psychologii. Velké uplatnění mohou nalézt také ve výuce češtiny, a to nejen na českých školách, ale i ve výuce češtiny pro cizince. Citovostí, kreativitou a často i humorem zaujmou i laické čtenáře. |
| |
Poznámka 2: | ==== Poděkování ==== |
KSK byl vytvořen v Ústavu českého jazyka na Filozofické fakultě Masarykovy univerzity v Brně (za přispění pracovníků Fakulty informatiky MU) v rámci projektu GA ČR 405/03/0248. Cílem projektu bylo připravit veřejně přístupný referenční zdroj pro studium současné soukromé korespondence a naznačit možnosti lingvistického využití epistolárních textů. K výstupům patří kromě KSK tištěná publikace a dvě CD Zdeňka Hladká a kol.: Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS. Brno: Masarykova univerzita 2005. Na CD je vedle ručně psaných dopisů zahrnutých paralelně do KSK zpracováno ještě 1000 e-mailů a cca 2000 SMS. Připojeny jsou také fotokopie všech 2000 ručně psaných dopisů, vzorek gramaticky označkovaného korpusu, statistické přehledy apod. Tištěná část publikace přináší detailní informace o metodice sběru a zpracování korespondenčních textů a zároveň na konkrétních příkladech naznačuje směry možného lingvistického využití korespondenčního materiálu. Práce vyšla v značně omezeném počtu kusů. Je neprodejná, distribuci zajišťuje pouze garant projektu (e-mail: zdena@phil.muni.cz). | |
| |
Zdeňka Hladká | KSK-dopisy byl vytvořen v Ústavu českého jazyka na Filozofické fakultě Masarykovy univerzity v Brně pod vedením Z. Hladké, na sběru a zpracování materiálu se podílela řada studentů FF MU. Dopisy shromážděné v KSK-dopisy byly získány od přímých účastníků korespondenčního styku (adresátů, případně i pisatelů), kteří explicitně souhlasili s jejich zveřejněním a využitím pro nekomerční studijní účely. Způsob zpracování zachovává anonymitu pisatelů, adresátů i dárců a eliminuje identifikační údaje uvedené v originálech textů (příjmení, adresy, telefonní čísla apod.). |
(garant projektu) | |
| |
Odkazy: | |
Doprovodné chrakteristiky v KSK | |
Sběr a přepis dopisů | |
Dělení nářečních oblastí v Českém jazykovém atlasu (mapa) | |
| |
| ===== Další informace o KSK-dopisy ===== |
| KSK-dopisy byl vytvořen v rámci projektu GA ČR 405/03/0248, jehož cílem projektu bylo připravit veřejně přístupný referenční zdroj pro studium současné soukromé korespondence a naznačit možnosti lingvistického využití epistolárních textů. K výstupům projektu patří kromě KSK-dopisy tištěná publikace a dvě CD **Zdeňka Hladká a kol.: Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS. Brno: Masarykova univerzita 2005**. Na CD je vedle ručně psaných dopisů zahrnutých paralelně do KSK-dopisy zpracováno ještě 1000 e-mailů a cca 2000 SMS. Připojeny jsou také fotokopie všech 2000 ručně psaných dopisů, vzorek gramaticky označkovaného korpusu (v rozsahu 1000 dopisů), statistické přehledy apod. Tištěná část publikace přináší detailní informace o metodice sběru a zpracování korespondenčních textů a zároveň na konkrétních příkladech naznačuje směry možného lingvistického využití korespondenčního materiálu. Práce vyšla jako neprodejná, v značně omezeném počtu kusů. Distribuci zajišťuje pouze garant projektu (e-mail: zdena@phil.muni.cz). |
| |
| ===== Jak citovat KSK-dopisy ===== |
| <WRAP round tip 70%> |
| Hladká, Z.: //KSK-dopisy (Korpus soukromé korespondence): přepisy ručně psaných dopisů z let 1990–-2004//. Ústav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: <http://www.korpus.cz>. |
| </WRAP> |
| |
| |
| |
| --- //[[https://www.muni.cz/lide/633-zdenka-hladka|Zdeňka Hladká]]// (garant KSK-dopisy) |
| |
| ===== Související odkazy ===== |
| <WRAP round box 49%> |
| [[cnk:ksk-prepis|Principy sběru a přepisu dopisů]] • [[pojmy:mluveny|Korpus mluveného jazyka]] • [[pojmy:psany|Korpus psaného jazyka]] • [[cnk:pmk|PMK]] • [[cnk:bmk|BMK]] |
| </WRAP> |