Nastavení

ParlCorp: Korpus českých parlamentní projevů

Korpus ParlCorp obsahuje monologické projevy pronesené na půdě Poslanecké Sněmovny České republiky. Základem korpusu jsou stenoprotokoly parlamentních jednání veřejně dostupné na doméně www.psp.cz. Korpus je lemmatizován a morfologicky značkován. Cílem korpusu je zpřístupnit parlamentní data lingvistickému bádání, ale i výzkumu v oblasti humanitních a společenských věd.

Název Parlcorp
Pozice Počet pozic (tokenů) 38 591 592
Počet slovních tvarů (wordů) 310 694
Počet lemmat 98 820
Struktury Počet parlamentních projevů <sp> 166 754
Počet mluvčích žen 239
Počet mluvčích mužů 1004
Počet vět <s> 1 750 728
Další informace Referenční NE (verze 2)
Období 1993–2021
Rok zveřejnění 2021

Texty zahrnují i krátké poznámky pronesené jako reakce na předchozí mluvčí, nebo komentáře předsedajícího pověřeného řízením schůze. Korpus tak zahrnuje široké spektrum parlamentních subžánrů (ústní a písemné interpelace, parlamentní rozpravy, projevy předsedy a členů vlády, pokyny při řízení sněmovny atd.).

Dostupná metadata

Pro každý projev jsou k dispozici dva druhy metadat: informace o textu a informace o mluvčím.

Informace vztahující se k textu

  • volební období – 8 volebních období (1993-1996, …, 2017-2021)
  • číslo schůze
  • datum zasedání
  • téma jednání
  • unikátní ID projevu

Informace vztahující se k mluvčímu

  • jméno – např. Taťána Fischerová
  • pohlaví – žena, muž
  • funkce/role – např. poslanec/poslankyně, předseda vlády, ministr/ministryně atd.
  • stranická příslušnost – politická strana či uskupení
  • pořadí projevu v rámci diskutovaného tématu

Jak citovat korpus Parlcorp

Berrocal, Martina – Berrocal, Manuel: ParlCorp: Korpus českých parlamentní projevů. Ústav Českého národního korpusu FF UK, Praha 2021. Dostupný z WWW: http://www.korpus.cz