Totalita: korpus jazyka totality

Korpus Totalita je diachronní korpus psané češtiny pokrývající období komunistické diktatury (1948–1989), který sloužil jako materiálová základna pro Slovník komunistické totality.

Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že značkování neodpovídá soudobému standardu značkování korpusů ČNK, na druhou stranu to však umožnilo zachovat výsledky manuální lemmatizace, která před vznikem slovníku proběhla.

Název Totalita
Pozice Počet pozic (tokenů) 15 350 741
Počet pozic bez interpunkce 12 909 992
Struktury Počet dokumentů <doc> 490
Počet vět <s> 813 311
Složení korpusu Rudé právo 1952 (pozice) 4 410 585
Rudé právo 1969 (pozice) 3 603 645
Rudé právo 1977 (pozice) 2 576 895
Ostatní publikace (pozice) 4 759 616
Rok zveřejnění 2010

Složení korpusu Totalita

Datové zdroje tvoří v úhrnu dva typy textů:

1. deník Rudé právo: celkem 400 souborů, celkem cca 10 milionů pozic (2/3 z celkového objemu), a to konkrétně ze tří období:

2. knihy a tiskoviny:

Cílem tvorby korpusu Totalita nebylo pokrýt celých 41 let, šlo jen o kriteriální výběr. Ten se opíral o tři historicky důležitá období zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin. Korpus Totalita navíc nereprezentuje celý tehdejší diskurz, protože obsahuje pouze jeho veřejnou, oficiální propagandou řízenou část. Najdeme v něm tedy typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: milice, kádrovat, uliční výbor, F. Čermákem nazývané V-jazyk, „jazyk komunistických vládců“), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Zcela však chybí tzv. O-jazyk, „jazyk ovládaných“ (esenbák, mukl, vekslovat).

Další literatura

Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): Slovník komunistické totality. Praha: NLN, s. 16–39.

Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: Jazyk v politických, ideologických a interkultúrnych vzťahoch. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50–60.

Jak citovat korpus Totalita

Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: Totalita: korpus jazyka komunistické totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz