AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:totalita [2023/02/22 14:37] michalskrabalcnk:totalita [2023/02/23 14:54] (aktuální) – [Totalita: korpus jazyka totality] michalkren
Řádek 2: Řádek 2:
 ====== Totalita: korpus jazyka totality ====== ====== Totalita: korpus jazyka totality ======
  
-Korpus Totalita je [[pojmy:diachronni|diachronní]] korpus psané češtiny pokrývající období komunistické diktatury (1948--1989), který sloužil jako materiálová základna pro [[https://www.nln.cz/knihy/slovnik-komunisticke-totality/|Slovník komunistické totality]]. Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že značkování již neodpovídá soudobému standardu značkování korpusů ČNK, na druhou stranu to však umožnilo zachovat výsledky náročné manuální lemmatizace, která před vznikem slovníku proběhla.  +Korpus Totalita je [[pojmy:diachronni|diachronní]] korpus psané češtiny pokrývající období komunistické diktatury (1948--1989), který sloužil jako materiálová základna pro [[https://www.nln.cz/knihy/slovnik-komunisticke-totality/|Slovník komunistické totality]]. 
 + 
 +Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že **značkování neodpovídá soudobému standardu** značkování korpusů ČNK, na druhou stranu to však umožnilo **zachovat výsledky manuální lemmatizace**, která před vznikem slovníku proběhla.  
  
 <WRAP right 40%> <WRAP right 40%>
-^ <fs medium>Název</fs> ^^^ <fs medium>Etalon</fs> ^ +^ <fs medium>Název</fs> ^^ <fs medium>Totalita</fs> ^ 
-^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] ^|  <html>2&nbsp;265&nbsp;762</html> |   +^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  15 350 741 |   
-^ ::: ^ Počet pozic bez interpunkce ^|  1 885 621 |  +^ ::: ^ Počet pozic bez interpunkce |  12 909 992 |  
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> ^|  94 +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> |  490 
-^ ::: ^ Počet vět <s> ^|  153 774 +^ ::: ^ Počet vět <s> |  813 311 
-^ Složení korpusu ^ Beletrie ^ pozice |  538 219 +^ Složení korpusu ^ Rudé právo 1952 (pozice|  4 410 585 
-^ ::: ^ ::: ^ slova |  436 548 +^ ::: ^ Rudé právo 1969 (pozice) |  3 603 645 
-^ ::: ^ ::: ^ věty |  38 919 | +^ ::: ^ Rudé právo 1977 (pozice|  2 576 895 
-^ ::: ^ Odborná literatura ^ pozice |  912 194 +^ ::: ^ Ostatní publikace (pozice|  4 759 616 
-^ ::: ^ ::: ^ slova |  758 227 | +^ Rok zveřejnění ^|  2010 |
-^ ::: ^ ::: ^ věty |  60 098 | +
-^ ::: ^ Publicistika ^ pozice |  815 349 | +
-^ ::: ^ ::: ^ slova |  690 846 | +
-^ ::: ^ ::: ^ věty |  54 757 +
-^ Rok zveřejnění ^^|  2021 |+
 </WRAP> </WRAP>
-FIXME 
  
 ===== Složení korpusu Totalita ===== ===== Složení korpusu Totalita =====
Řádek 27: Řádek 23:
 Datové zdroje tvoří v úhrnu dva typy textů: Datové zdroje tvoří v úhrnu dva typy textů:
  
-1. Rudé právo: celkem 400 souborů, celkem cca 10 milionů pozic (2/3 z celkového objemu), a to konkrétně ze tří období:+1. deník Rudé právo: celkem 400 souborů, celkem cca 10 milionů pozic (2/3 z celkového objemu), a to konkrétně ze tří období:
   * ročník 1952 (dvě poslední čtvrtletí): 6. 6. -- 31. 12. 1952   * ročník 1952 (dvě poslední čtvrtletí): 6. 6. -- 31. 12. 1952
   * ročník 1969 (druhé čtvrtletí): 1. 4. -- 31. 4. 1969   * ročník 1969 (druhé čtvrtletí): 1. 4. -- 31. 4. 1969
   * ročník 1977 (první čtvrtletí): 3. 1. -- 31. 3. 1977   * ročník 1977 (první čtvrtletí): 3. 1. -- 31. 3. 1977
    
-2. Knihy a tiskoviny:  +2. knihy a tiskoviny:  
-91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to1952 (23 knih), 1969 (10 knih)1977 (58 knih)+  91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to z let 1952 (23 knih), 1969 (10 knih) 1977 (58 knih) 
 + 
 +Cílem tvorby korpusu Totalita nebylo pokrýt celých 41 let, šlo jen o kriteriální výběr. Ten se opíral o tři historicky důležitá období zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin. Korpus Totalita navíc nereprezentuje celý tehdejší diskurz, protože obsahuje pouze jeho veřejnou, oficiální propagandou řízenou část. Najdeme v něm tedy typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: //milice//, //kádrovat//, //uliční výbor//, F. Čermákem nazývané V-jazyk, „jazyk komunistických vládců“), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Zcela však chybí tzv. O-jazyk, „jazyk ovládaných“ (//esenbák//, //mukl//, //vekslovat//). 
 + 
 +**Další literatura** 
 + 
 +Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): //Slovník komunistické totality//. Praha: NLN, s. 16--39. 
 + 
 +Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: //Jazyk v politických, ideologických a interkultúrnych vzťahoch//. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50--60. 
  
-Protože cílem tvorby korpusu Totalita nebylo pokrýt celé období 41 let vyčerpávajícím způsobem, muselo jít jen o kriteriální výběr. Ten byl možný při opření se o závažná tří období, jejichž výběr se opíral o historická kritéria, zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin. Navíc není tento korpus jazykově reprezentativní pro celý tehdejší diskurz, ale pouze pro jeho veřejný segment. Čistě obsahově stojí na jedné straně typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: //milice//, //kádrovat//, //uliční výbor//, F. Čermákem nazývaný V-jazyk, „jazyk komunistických vládců“), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Tento lexikon koexistoval s normálním, věcně neutrálním slovníkem pro věci, realitu nezasažené politikou, a tedy většinu věcí každodenního života (kdy lexémy jako //chléb//, //autobus// či //cestovat// ideologii nepodléhají), které byly před onou dobou a většinou i po ní. Zcela však chybí O-jazyk, „jazyk ovládaných“ (//esenbák//, //mukl//, //vekslovat//). 
  
 ===== Jak citovat korpus Totalita ===== ===== Jak citovat korpus Totalita =====
  
 <WRAP round tip 70%> <WRAP round tip 70%>
-Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: TOTALITA: korpus jazyka totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz+Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: Totalita: korpus jazyka komunistické totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz
 </WRAP> </WRAP>
  
-===== Další literatura ===== 
  
-<WRAP round tip 70%> 
-Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): Slovník komunistické totality. Praha: NLN, s. 16--39. 
- 
-Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: Jazyk v politických, ideologických a interkultúrnych vzťahoch. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50--60.  
-</WRAP>