AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:totalita [2023/02/22 14:56] – [Složení korpusu Totalita] Michal Křencnk:totalita [2023/02/23 14:54] (aktuální) – [Totalita: korpus jazyka totality] Michal Křen
Řádek 2: Řádek 2:
 ====== Totalita: korpus jazyka totality ====== ====== Totalita: korpus jazyka totality ======
  
-Korpus Totalita je [[pojmy:diachronni|diachronní]] korpus psané češtiny pokrývající období komunistické diktatury (1948--1989), který sloužil jako materiálová základna pro [[https://www.nln.cz/knihy/slovnik-komunisticke-totality/|Slovník komunistické totality]]. Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že značkování již neodpovídá soudobému standardu značkování korpusů ČNK, na druhou stranu to však umožnilo zachovat výsledky náročné manuální lemmatizace, která před vznikem slovníku proběhla.  +Korpus Totalita je [[pojmy:diachronni|diachronní]] korpus psané češtiny pokrývající období komunistické diktatury (1948--1989), který sloužil jako materiálová základna pro [[https://www.nln.cz/knihy/slovnik-komunisticke-totality/|Slovník komunistické totality]]. 
 + 
 +Korpus byl převzat z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že **značkování neodpovídá soudobému standardu** značkování korpusů ČNK, na druhou stranu to však umožnilo **zachovat výsledky manuální lemmatizace**, která před vznikem slovníku proběhla.  
  
 <WRAP right 40%> <WRAP right 40%>
-^ <fs medium>Název</fs> ^^^ <fs medium>Etalon</fs> ^ +^ <fs medium>Název</fs> ^^ <fs medium>Totalita</fs> ^ 
-^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] ^|  <html>2&nbsp;265&nbsp;762</html> |   +^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  15 350 741 |   
-^ ::: ^ Počet pozic bez interpunkce ^|  1 885 621 |  +^ ::: ^ Počet pozic bez interpunkce |  12 909 992 |  
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> ^|  94 +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> |  490 
-^ ::: ^ Počet vět <s> ^|  153 774 +^ ::: ^ Počet vět <s> |  813 311 
-^ Složení korpusu ^ Beletrie ^ pozice |  538 219 +^ Složení korpusu ^ Rudé právo 1952 (pozice|  4 410 585 
-^ ::: ^ ::: ^ slova |  436 548 +^ ::: ^ Rudé právo 1969 (pozice) |  3 603 645 
-^ ::: ^ ::: ^ věty |  38 919 | +^ ::: ^ Rudé právo 1977 (pozice|  2 576 895 
-^ ::: ^ Odborná literatura ^ pozice |  912 194 +^ ::: ^ Ostatní publikace (pozice|  4 759 616 
-^ ::: ^ ::: ^ slova |  758 227 | +^ Rok zveřejnění ^|  2010 |
-^ ::: ^ ::: ^ věty |  60 098 | +
-^ ::: ^ Publicistika ^ pozice |  815 349 | +
-^ ::: ^ ::: ^ slova |  690 846 | +
-^ ::: ^ ::: ^ věty |  54 757 +
-^ Rok zveřejnění ^^|  2021 |+
 </WRAP> </WRAP>
-FIXME 
  
 ===== Složení korpusu Totalita ===== ===== Složení korpusu Totalita =====
Řádek 35: Řádek 31:
   * 91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to z let 1952 (23 knih), 1969 (10 knih) a 1977 (58 knih)   * 91 knih, celkem cca 5 milionů pozic (1/3 z celkového objemu), a to z let 1952 (23 knih), 1969 (10 knih) a 1977 (58 knih)
  
-Protože cílem tvorby korpusu Totalita nebylo pokrýt celé období 41 let vyčerpávajícím způsobem, šlo jen o kriteriální výběr. Ten se opíral o tři historicky závažná období zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin. Korpus Totalita navíc není jazykově reprezentativní pro celý tehdejší diskurz, ale pouze pro jeho veřejný, oficiální propagandou řízený segmentČistě obsahově stojí na jedné straně typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: //milice//, //kádrovat//, //uliční výbor//, F. Čermákem nazývaný V-jazyk, „jazyk komunistických vládců“), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Tento lexikon koexistoval s normálním, věcně neutrálním slovníkem pro věci, realitu nezasažené politikou, a tedy většinu věcí každodenního života (kdy lexémy jako //chléb//, //autobus// či //cestovat// ideologii nepodléhají), které byly před onou dobou a většinou i po ní. Zcela však chybí tzv. O-jazyk, „jazyk ovládaných“ (//esenbák//, //mukl//, //vekslovat//).+Cílem tvorby korpusu Totalita nebylo pokrýt celých 41 let, šlo jen o kriteriální výběr. Ten se opíral o tři historicky důležitá období zastoupená uvedenými kvartály Rudého práva a do značné míry i časově korelovanou volbou knih a tiskovin. Korpus Totalita navíc nereprezentuje celý tehdejší diskurz, protože obsahuje pouze jeho veřejnou, oficiální propagandou řízenou částNajdeme v něm tedy typický a dominantní lexikon totalitní (tj. výrazivo specifické pro svou dobu z hlediska ideologického a politického, zvláště však propagandistického: //milice//, //kádrovat//, //uliční výbor//, F. Čermákem nazývané V-jazyk, „jazyk komunistických vládců“), tvořící obsah tehdy vydávaných tiskovin všeho druhu. Zcela však chybí tzv. O-jazyk, „jazyk ovládaných“ (//esenbák//, //mukl//, //vekslovat//).
  
 **Další literatura** **Další literatura**
  
-Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): Slovník komunistické totality. Praha: NLN, s. 16--39.+Čermák, F.: Slovník komunistické totality: léxémy, nominace a jejich užití. In: Čermák, F. – Cvrček, V. – Schmiedtová, V. (eds) (2010): //Slovník komunistické totality//. Praha: NLN, s. 16--39.
  
-Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: Jazyk v politických, ideologických a interkultúrnych vzťahoch. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50--60. +Čermák, F.: Jazyk totality a dneška: jak odráží realitu a ovlivňuje lidské vědomí. Language of Totalitarianism and of Today: How it Reflects Reality and Influences Human Consciousness. In: //Jazyk v politických, ideologických a interkultúrnych vzťahoch//. Sociolinguistica Slovaca 8. Veda, Bratislava 2015, s. 50--60. 
  
  
Řádek 47: Řádek 43:
  
 <WRAP round tip 70%> <WRAP round tip 70%>
-Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: TOTALITA: korpus jazyka totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz+Skoumalová, H. – Bartoň, T. – Cvrček, V. – Hnátková, M. – Kocek, J.: Totalita: korpus jazyka komunistické totality. Ústav Českého národního korpusu FF UK, Praha 2010. Dostupný z WWW: http://www.korpus.cz
 </WRAP> </WRAP>