AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:totalita [2023/02/22 14:10] Michal Škrabalcnk:totalita [2023/02/23 14:54] (aktuální) – [Totalita: korpus jazyka totality] Michal Křen
Řádek 2: Řádek 2:
 ====== Totalita: korpus jazyka totality ====== ====== Totalita: korpus jazyka totality ======
  
-Korpus Totalita je [[pojmy:diachronni|diachronní]] korpus psané češtiny pokrývající období komunistické diktatury (1948--1989), který sloužil jako materiálová základna pro [[https://www.nln.cz/knihy/slovnik-komunisticke-totality/|Slovník komunistické totality]]. +Korpus Totalita je [[pojmy:diachronni|diachronní]] korpus psané češtiny pokrývající období komunistické diktatury (1948--1989), který sloužil jako materiálová základna pro [[https://www.nln.cz/knihy/slovnik-komunisticke-totality/|Slovník komunistické totality]]. 
 + 
 +Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že **značkování neodpovídá soudobému standardu** značkování korpusů ČNK, na druhou stranu to však umožnilo **zachovat výsledky manuální lemmatizace**, která před vznikem slovníku proběhla.  
  
 <WRAP right 40%> <WRAP right 40%>
-^ <fs medium>Název</fs> ^^^ <fs medium>Etalon</fs> ^ +^ <fs medium>Název</fs> ^^ <fs medium>Totalita</fs> ^ 
-^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] ^|  <html>2&nbsp;265&nbsp;762</html> |   +^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  15 350 741 |   
-^ ::: ^ Počet pozic bez interpunkce ^|  1 885 621 |  +^ ::: ^ Počet pozic bez interpunkce |  12 909 992 |  
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> ^|  94 +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> |  490 
-^ ::: ^ Počet vět <s> ^|  153 774 +^ ::: ^ Počet vět <s> |  813 311 
-^ Složení korpusu ^ Beletrie ^ pozice |  538 219 +^ Složení korpusu ^ Rudé právo 1952 (pozice|  4 410 585 
-^ ::: ^ ::: ^ slova |  436 548 +^ ::: ^ Rudé právo 1969 (pozice) |  3 603 645 
-^ ::: ^ ::: ^ věty |  38 919 | +^ ::: ^ Rudé právo 1977 (pozice|  2 576 895 
-^ ::: ^ Odborná literatura ^ pozice |  912 194 +^ ::: ^ Ostatní publikace (pozice|  4 759 616 
-^ ::: ^ ::: ^ slova |  758 227 | +^ Rok zveřejnění ^|  2010 |
-^ ::: ^ ::: ^ věty |  60 098 | +
-^ ::: ^ Publicistika ^ pozice |  815 349 | +
-^ ::: ^ ::: ^ slova |  690 846 | +
-^ ::: ^ ::: ^ věty |  54 757 +
-^ Rok zveřejnění ^^|  2021 |+
 </WRAP> </WRAP>
-FIXME 
  
 ===== Složení korpusu Totalita ===== ===== Složení korpusu Totalita =====
Řádek 27: Řádek 23:
 Datové zdroje tvoří v úhrnu dva typy textů: Datové zdroje tvoří v úhrnu dva typy textů:
  
-1. Rudé právo: celkem 400 souborů, celkem cca 10 milionů pozic (2/3 z celkového objemu), a to konkrétně ze tří období:+1. deník Rudé právo: celkem 400 souborů, celkem cca 10 milionů pozic (2/3 z celkového objemu), a to konkrétně ze tří období:
   * ročník 1952 (dvě poslední čtvrtletí): 6. 6. -- 31. 12. 1952   * ročník 1952 (dvě poslední čtvrtletí): 6. 6. -- 31. 12. 1952
   * ročník 1969 (druhé čtvrtletí): 1. 4. -- 31. 4. 1969   * ročník 1969 (druhé čtvrtletí): 1. 4. -- 31. 4. 1969
   * ročník 1977 (první čtvrtletí): 3. 1. -- 31. 3. 1977   * ročník 1977 (první čtvrtletí): 3. 1. -- 31. 3. 1977
    
-2. Knihy a tiskoviny:  +2. knihy a tiskoviny:  
- 91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to: rok (počet knih)  +  91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to z let 1952 (23 knih), 1969 (10 knih1977 (58 knih) 
- 1952 (23), 1969 (10)1977 (58)+ 
 +Cílem tvorby korpusu Totalita nebylo pokrýt celých 41 let, šlo jen o kriteriální výběr. Ten se opíral o tři historicky důležitá období zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin. Korpus Totalita navíc nereprezentuje celý tehdejší diskurz, protože obsahuje pouze jeho veřejnou, oficiální propagandou řízenou část. Najdeme v něm tedy typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: //milice//, //kádrovat//, //uliční výbor//, F. Čermákem nazývané V-jazyk, „jazyk komunistických vládců“), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Zcela však chybí tzv. O-jazyk, „jazyk ovládaných“ (//esenbák//, //mukl//, //vekslovat//). 
 + 
 +**Další literatura** 
 + 
 +Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): //Slovník komunistické totality//. Praha: NLN, s. 16--39. 
 + 
 +Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: //Jazyk v politických, ideologických a interkultúrnych vzťahoch//. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50--60. 
  
- Protože cílem tvorby korpusu Totalita nebylo pokrýt celé období 41 let vyčerpávajícím způsobem, muselo jít jen o kriteriální výběr. Ten byl možný při opření se o závažná tří období, jejichž výběr se opíral o historická kritéria, zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin (viz 1 a 2). Při absenci plného dobového korpusu je tak Totalita do značné míry svou skladbou jazykově reprezentativní pro celou komunistickou éru. Čistě obsahově stojí na jedné straně typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: //milice//, //kádrovat//, //uliční výbor//), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Tento lexikon koexistoval s normálním, věcně neutrálním slovníkem pro věci, realitu nezasažené politikou, a tedy většinu věcí každodenního života (kdy lexémy jako //chléb//, //autobus// či //cestovat// ideologii nepodléhají), které byly před onou dobou a většinou i po ní. I ten byl součástí běžných tištěných pramenů; jemu se v dalším však věnuje pozornost jen okrajová.  
  
 ===== Jak citovat korpus Totalita ===== ===== Jak citovat korpus Totalita =====
  
 <WRAP round tip 70%> <WRAP round tip 70%>
-Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: TOTALITA: korpus jazyka totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz+Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: Totalita: korpus jazyka komunistické totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz
 </WRAP> </WRAP>
  
-===== Další literatura ===== 
  
-<WRAP round tip 70%> 
-Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): Slovník komunistické totality. Praha: NLN, s. 16--39. 
- 
-Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: Jazyk v politických, ideologických a interkultúrnych vzťahoch. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50--60.  
-</WRAP>