Toto je starší verze dokumentu!
Totalita: korpus jazyka totality
Korpus Totalita je diachronní korpus psané češtiny pokrývající období komunistické diktatury (1948–1989), který sloužil jako materiálová základna pro Slovník komunistické totality. Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že značkování již neodpovídá soudobému standardu značkování korpusů ČNK, na druhou stranu to však umožnilo zachovat výsledky manuální lemmatizace, která před vznikem slovníku proběhla.
Název | Totalita | |
---|---|---|
Pozice | Počet pozic (tokenů) | 15 350 741 |
Počet pozic bez interpunkce | 12 909 992 | |
Struktury | Počet dokumentů <doc> | 490 |
Počet vět <s> | 813 311 | |
Složení korpusu | Rudé právo 1952 (pozice) | 4 410 585 |
Rudé právo 1969 (pozice) | 3 603 645 | |
Rudé právo 1977 (pozice) | 2 576 895 | |
Ostatní publikace (pozice) | 4 759 616 | |
Rok zveřejnění | 2010 |
Složení korpusu Totalita
Datové zdroje tvoří v úhrnu dva typy textů:
1. deník Rudé právo: celkem 400 souborů, celkem cca 10 milionů pozic (2/3 z celkového objemu), a to konkrétně ze tří období:
- ročník 1952 (dvě poslední čtvrtletí): 6. 6. – 31. 12. 1952
- ročník 1969 (druhé čtvrtletí): 1. 4. – 31. 4. 1969
- ročník 1977 (první čtvrtletí): 3. 1. – 31. 3. 1977
2. knihy a tiskoviny:
- 91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to z let 1952 (23 knih), 1969 (10 knih) a 1977 (58 knih)
Cílem tvorby korpusu Totalita nebylo pokrýt celých 41 let, šlo jen o kriteriální výběr. Ten se opíral o tři historicky důležitá období zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin. Korpus Totalita navíc nereprezentuje celý tehdejší diskurz, protože obsahuje pouze jeho veřejnou, oficiální propagandou řízenou část. Najdeme v něm tedy typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: milice, kádrovat, uliční výbor, F. Čermákem nazývaný V-jazyk, „jazyk komunistických vládců“), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Zcela však chybí tzv. O-jazyk, „jazyk ovládaných“ (esenbák, mukl, vekslovat).
Další literatura
Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): Slovník komunistické totality. Praha: NLN, s. 16–39.
Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: Jazyk v politických, ideologických a interkultúrnych vzťahoch. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50–60.
Jak citovat korpus Totalita
Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: TOTALITA: korpus jazyka totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz