AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


ParlCorp: Korpus českých parlamentní projevů

Korpus ParlCorp obsahuje monologické projevy pronesené na půdě Poslanecké Sněmovny České republiky. Základem korpusu jsou stenoprotokoly parlamentních jednání veřejně dostupné na doméně www.psp.cz. Korpus je lemmatizován a morfologicky značkován. Cílem korpusu je zpřístupnit parlamentní data lingvistickému bádání, ale i výzkumu v oblasti humanitních a společenských věd.

Název Parlcorp
Pozice Počet pozic (tokenů) 38 591 592
Počet slovních tvarů (wordů) 310 694
Počet lemmat 98 820
Struktury Počet parlamentních projevů <sp> 166 754
Počet mluvčích žen 239
Počet mluvčích mužů 1004
Počet vět <s> 1 750 728
Další informace Referenční NE
Rok zveřejnění 2021