Nastavení

Korpusy textů Karla Čapka

Korpusy 'capek' a 'capek_uplny' jsou autorskými korpusy Karla Čapka, které vznikly jako datový podklad Slovníku Karla Čapka. Korpus 'capek' obsahuje všechny texty, které napsal Karel Čapek nesporně sám, a to jak z hlediska spoluautorství, tak i ovlivněnosti partnerem nebo překládaným originálem, zatímco korpus 'capek_uplny' je úplným souborem všech textů, na nichž se Karel Čapek jakkoli autorsky podílel (např. tedy včetně textů, které napsal spolu s bratrem Josefem). Znamená to tedy, že korpus 'capek' je podmnožinou korpusu 'capek_uplny', rozdělení na dva korpusy jsme se rozhodli ponechat kvůli zachování věrnosti slovníku.

Oba korpusy byly převzaty z doprovodného CD ke slovníku, nezměnila se ani uváděná metadata, ani lemmatizace a morfologické značkování. To sice na jednu stranu znamená, že značkování již neodpovídá soudobému standardu značkování korpusů ČNK, na druhou stranu to však umožnilo zachovat výsledky náročné manuální lemmatizace, která před vznikem slovníku proběhla.

Jak citovat

Čermák, F. et al.: Capek: korpus pouze vlastních textů Karla Čapka. Ústav Českého národního korpusu FF UK, Praha 2007. Dostupný z WWW: http://www.korpus.cz

Čermák, F. et al.: Capek_uplny: korpus všech textů Karla Čapka. Ústav Českého národního korpusu FF UK, Praha 2007. Dostupný z WWW: http://www.korpus.cz

Čermák, F. (ed.): Slovník Karla Čapka. Nakladatelství Lidové noviny, Praha 2007.