AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Totalita: korpus jazyka totality

Korpus Totalita je diachronní korpus psané češtiny pokrývající období komunistické diktatury (1948–1989), který sloužil jako materiálová základna pro Slovník komunistické totality.

Název Etalon
Pozice Počet pozic (tokenů)
2 265 762
Počet pozic bez interpunkce 1 885 621
Struktury Počet dokumentů <doc> 94
Počet vět <s> 153 774
Složení korpusu Beletrie pozice 538 219
slova 436 548
věty 38 919
Odborná literatura pozice 912 194
slova 758 227
věty 60 098
Publicistika pozice 815 349
slova 690 846
věty 54 757
Rok zveřejnění 2021

FIXME

Složení korpusu Totalita

Datové zdroje tvoří v úhrnu dva typy textů:

1. Rudé právo: celkem 400 souborů, celkem cca 10 milionů pozic (2/3 z celkového objemu), a to konkrétně ze tří období:

  • ročník 1952 (dvě poslední čtvrtletí): 6. 6. – 31. 12. 1952
  • ročník 1969 (druhé čtvrtletí): 1. 4. – 31. 4. 1969
  • ročník 1977 (první čtvrtletí): 3. 1. – 31. 3. 1977

2. Knihy a tiskoviny:

91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to: rok (počet knih) 
1952 (23), 1969 (10), 1977 (58)
Protože cílem tvorby korpusu Totalita nebylo pokrýt celé období 41 let vyčerpávajícím způsobem, muselo jít jen o kriteriální výběr. Ten byl možný při opření se o závažná tří období, jejichž výběr se opíral o historická kritéria, zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin (viz 1 a 2). Při absenci plného dobového korpusu je tak Totalita do značné míry svou skladbou jazykově reprezentativní pro celou komunistickou éru. Čistě obsahově stojí na jedné straně typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: //milice//, //kádrovat//, //uliční výbor//), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Tento lexikon koexistoval s normálním, věcně neutrálním slovníkem pro věci, realitu nezasažené politikou, a tedy většinu věcí každodenního života (kdy lexémy jako //chléb//, //autobus// či //cestovat// ideologii nepodléhají), které byly před onou dobou a většinou i po ní. I ten byl součástí běžných tištěných pramenů; jemu se v dalším však věnuje pozornost jen okrajová. 

Jak citovat korpus Totalita

Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: TOTALITA: korpus jazyka totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz

Další literatura

Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): Slovník komunistické totality. Praha: NLN, s. 16–39.

Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: Jazyk v politických, ideologických a interkultúrnych vzťahoch. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50–60.