ParlCorp: Korpus českých parlamentní projevů
Korpus ParlCorp obsahuje monologické projevy pronesené na půdě Poslanecké Sněmovny České republiky. Základem korpusu jsou stenoprotokoly parlamentních jednání veřejně dostupné na doméně www.psp.cz. Korpus je lemmatizován a morfologicky značkován. Cílem korpusu je zpřístupnit parlamentní data lingvistickému bádání, ale i výzkumu v oblasti humanitních a společenských věd.
Název | Parlcorp | |
---|---|---|
Pozice | Počet pozic (tokenů) | 38 591 592 |
Počet slovních tvarů (wordů) | 310 694 | |
Počet lemmat | 98 820 | |
Struktury | Počet parlamentních projevů <sp> | 166 754 |
Počet mluvčích žen | 239 | |
Počet mluvčích mužů | 1004 | |
Počet vět <s> | 1 750 728 | |
Další informace | Referenční | NE (verze 2) |
Období | 1993–2021 | |
Rok zveřejnění | 2021 |
Texty zahrnují i krátké poznámky pronesené jako reakce na předchozí mluvčí, nebo komentáře předsedajícího pověřeného řízením schůze. Korpus tak zahrnuje široké spektrum parlamentních subžánrů (ústní a písemné interpelace, parlamentní rozpravy, projevy předsedy a členů vlády, pokyny při řízení sněmovny atd.).
Dostupná metadata
Pro každý projev jsou k dispozici dva druhy metadat: informace o textu a informace o mluvčím.
Informace vztahující se k textu
- volební období – 8 volebních období (1993-1996, …, 2017-2021)
- číslo schůze
- datum zasedání
- téma jednání
- unikátní ID projevu
Informace vztahující se k mluvčímu
- jméno – např. Taťána Fischerová
- pohlaví – žena, muž
- funkce/role – např. poslanec/poslankyně, předseda vlády, ministr/ministryně atd.
- stranická příslušnost – politická strana či uskupení
- pořadí projevu v rámci diskutovaného tématu
Jak citovat korpus Parlcorp
Berrocal, Martina – Berrocal, Manuel: ParlCorp: Korpus českých parlamentní projevů. Ústav Českého národního korpusu FF UK, Praha 2021. Dostupný z WWW: http://www.korpus.cz