AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
cnk:parlcorp [2021/06/03 20:52] – vytvořeno vaclavcvrcekcnk:parlcorp [2021/06/05 15:04] (aktuální) vaclavcvrcek
Řádek 1: Řádek 1:
 +~~NOTOC~~
 ====== ParlCorp: Korpus českých parlamentní projevů ====== ====== ParlCorp: Korpus českých parlamentní projevů ======
  
-Korpus ParlCorp obsahuje monologické projevy pronesené na půdě Poslanecké Sněmovny České republiky. Základem korpusu jsou stenoprotokoly parlamentních jednání veřejně dostupné na doméně [[www.psp.cz]]. Korpus je lemmatizován a morfologicky značkován. Cílem korpusu je zpřístupnit parlamentní data lingvistickému bádání, ale i výzkumu v oblasti humanitních a společenských věd.   +Korpus ParlCorp obsahuje monologické projevy pronesené na půdě Poslanecké Sněmovny České republiky. Základem korpusu jsou stenoprotokoly parlamentních jednání veřejně dostupné na doméně [[https://www.psp.cz|www.psp.cz]]. Korpus je [[pojmy:lemma|lemmatizován]] [[pojmy:tag|morfologicky značkován]]. Cílem korpusu je zpřístupnit parlamentní data lingvistickému bádání, ale i výzkumu v oblasti humanitních a společenských věd. 
 + 
 +<WRAP right 45%> 
 +^ <fs medium>Název</fs> ^^ <fs medium>Parlcorp</fs>
 +^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  38 591 592 |   
 +^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  310 694 |   
 +^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  98 820 | 
 +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet parlamentních projevů <sp> |  166 754 | 
 +^ ::: ^ Počet mluvčích žen |  239 | 
 +^ ::: ^ Počet mluvčích mužů |  1004 | 
 +^ ::: ^ Počet vět <s> |  1 750 728 | 
 +^ Další informace ^ [[pojmy:referencni|Referenční]] |  NE (verze 2) |   
 +^ ::: ^ Období |  1993–2021 | 
 +^ ::: ^ Rok zveřejnění |  2021 | 
 +</WRAP> 
 + 
 +Texty zahrnují i krátké poznámky pronesené jako reakce na předchozí mluvčí, nebo komentáře předsedajícího pověřeného řízením schůze. Korpus tak zahrnuje široké spektrum parlamentních subžánrů (ústní a písemné interpelace, parlamentní rozpravy, projevy předsedy a členů vlády, pokyny při řízení sněmovny atd.). 
 + 
 +===== Dostupná metadata ===== 
 + 
 + 
 +Pro každý projev jsou k dispozici dva druhy metadat: informace o textu a informace o mluvčím.  
 + 
 +==== Informace vztahující se k textu ==== 
 + 
 +  * volební období – 8 volebních období (1993-1996, ..., 2017-2021) 
 +  * číslo schůze 
 +  * datum zasedání 
 +  * téma jednání  
 +  * unikátní ID projevu 
 + 
 +==== Informace vztahující se k mluvčímu ==== 
 + 
 +  * jméno – např. Taťána Fischerová  
 +  * pohlaví – žena, muž 
 +  * funkce/role – např. poslanec/poslankyně, předseda vlády, ministr/ministryně atd. 
 +  * stranická příslušnost – politická strana či uskupení  
 +  * pořadí projevu v rámci diskutovaného tématu   
 + 
 +===== Jak citovat korpus Parlcorp ===== 
 + 
 +<WRAP round tip 70%> 
 +Berrocal, Martina – Berrocal, Manuel: //ParlCorp: Korpus českých parlamentní projevů//. Ústav Českého národního korpusu FF UK, Praha 2021. Dostupný z WWW: http://www.korpus.cz 
 +</WRAP>