Toto je starší verze dokumentu!
ParlCorp: Korpus českých parlamentní projevů
Korpus ParlCorp obsahuje monologické projevy pronesené na půdě Poslanecké Sněmovny České republiky. Základem korpusu jsou stenoprotokoly parlamentních jednání veřejně dostupné na doméně www.psp.cz. Korpus je lemmatizován a morfologicky značkován. Cílem korpusu je zpřístupnit parlamentní data lingvistickému bádání, ale i výzkumu v oblasti humanitních a společenských věd.
| Název | Parlcorp | |
|---|---|---|
| Pozice | Počet pozic (tokenů) | 38 591 592 |
| Počet slovních tvarů (wordů) | 310 694 | |
| Počet lemmat | 98 820 | |
| Struktury | Počet parlamentních projevů <sp> | 166 754 |
| Počet mluvčích žen | 239 | |
| Počet mluvčích mužů | 1004 | |
| Počet vět <s> | 1 750 728 | |
| Další informace | Referenční | NE |
| Rok zveřejnění | 2021 | |