Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:ksp [2022/08/14 09:36] – michalskrabal | cnk:ksp [2024/11/05 10:28] (aktuální) – [Složení korpusu] michalskrabal |
---|
====== Korpus současné poezie ====== | ====== Korpus současné poezie ====== |
FIXME | |
| |
Jedná se, jak už název napovídá, o korpus současných básnických textů české provenience vymezené lety 1990 a 2020, tj. reprezentativní vzorek tuzemského básnictví za poslední tři dekády. Co je podstatné, tento vzorek zahrnuje nejen texty oficiálně knižně vydané, a tedy i prošlé klasickým edičním procesem, ale i tvorbu amatérskou, koncentrovanou především na tzv. literární servery. Toto metodologické rozhodnutí není dáno snahou o jakousi demokratizaci poezie; věříme, že bez webových textů by obraz současné české poezie nebyl úplný, postihoval by pouze jeden její -- co do proporce dosti malý -- segment. To by neodpovídalo realitě, kdy literární servery sehrály v českém literárním kontextu významnou roli ((PIORECKÝ, Karel. Česká literatura a nová média. Praha: Academia, 2016.)), mj. jako platforma pro publikační začátky některých dnes již etablovaných básníků. Tato základní dichotomie nám mimochodem otevírá možnost oba módy, v KSP rozlišované pomocí atributu doc.medium (print vs. web), vzájemně konfrontovat a srovnávat. | KSP vzniká od roku 2015 ve spolupráci [[https://ucl.cas.cz/|Ústavu pro českou literaturu AV ČR, v. v. i.]] a ÚČNK. Jedná se, jak už název napovídá, o korpus současných básnických textů české provenience (vymezené lety 1990 a 2020), tj. reprezentativní vzorek tuzemského básnictví za poslední tři dekády. Co je podstatné, tento vzorek zahrnuje nejen texty oficiálně knižně vydané, a tedy i prošlé klasickým edičním procesem, ale i tvorbu amatérskou, koncentrovanou především na tzv. literární servery. Toto metodologické rozhodnutí není dáno snahou o jakousi demokratizaci poezie; věříme, že bez webových textů by obraz současné české poezie nebyl úplný, postihoval by pouze jeden její -- co do proporce dosti malý -- segment. To by neodpovídalo realitě, kdy literární servery sehrály v českém literárním kontextu významnou roli((PIORECKÝ, Karel. Česká literatura a nová média. Praha: Academia, 2016.)), mj. jako platforma pro publikační začátky některých dnes již etablovaných básníků. Tato základní dichotomie nám mimochodem otevírá možnost oba módy, v KSP rozlišované pomocí atributu ''doc.medium'' (print vs. web), vzájemně konfrontovat a srovnávat. |
| |
<WRAP right 35%> | <WRAP right 35%> |
^ <fs medium>Název</fs> ^^ <fs medium>KSP</fs> ^ | ^ <fs medium>Název</fs> | <fs medium>KSP • v1</fs> | <fs medium>KSP • v2</fs> | |
^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] | 42 435 867 | | ^ Počet [[pojmy:token|pozic (tokenů)]] | 42 435 867 | 43 224 671 | |
^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] | 35 506 057 | | ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] | 35 506 057 | 37 508 079 | |
^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] | 900 203 | | ^ Počet [[pojmy:word|slovních tvarů (wordů)]] | 900 203 | 881 306 | |
^ ::: ^ Počet [[pojmy:lemma|lemmat]] | 378 233 | | ^ Počet [[pojmy:lemma|lemmat]] | 378 233 | 339 907 | |
^ ::: ^ Rok zveřejnění | 2022 | | ^ Rok zveřejnění | 2022 | 2024 | |
</WRAP> | </WRAP> |
| |
===== Složení korpusu ===== | ===== Složení korpusu ===== |
| |
KSP obsahuje v tuto chvíli přibližně 35,5 milionů slov. Subkorpus tištěné poezie (print) se na tomto počtu podílí zhruba 1,7 miliony slov pocházejících z 21 478 básní otištěných ve 496 básnických sbírkách od 209 autorů. Webová složka korpusu (web) obsahuje více než 442 tisíc básní ze šestice literárních serverů (liter.cz, pismak.cz, totem.cz, libres.cz, psanci.cz, xxvi.cz), čítajících přes 34 milionů slov. Do subkorpusu print byly texty vybírány s ohledem na generační vrstevnatost současné básnické scény; aktuálně jsou tu reprezentativně zastoupeni autoři generací X a Y (tj. narození po roce 1965); v rozšiřování korpusu pokračujeme směrem ke starším generačním vrstvám. | KSP obsahuje v tuto chvíli přibližně 37,5 milionů slov. Subkorpus tištěné poezie (print) se na tomto počtu podílí zhruba 2,7 miliony slov pocházejících z 27 675 básní otištěných ve 682 básnických sbírkách od 256 autorů. Webová složka korpusu (web) obsahuje více než 280 tisíc básní ze šestice literárních serverů (liter.cz, pismak.cz, totem.cz, libres.cz, psanci.cz, xxvi.cz), čítajících přes 34 milionů slov. Do subkorpusu print byly texty vybírány s ohledem na generační vrstevnatost současné básnické scény; aktuálně jsou tu reprezentativně zastoupeni autoři generací X a Y a tzv. baby boomers (tj. všichni narození po roce 1945); v rozšiřování korpusu pokračujeme směrem ke starším generačním vrstvám. |
| |
Detaily týkající se budování KSP najdete v níže uvedených studiích. | Detaily týkající se budování KSP najdete v níže uvedených studiích. |
===== Využití korpusu ===== | ===== Využití korpusu ===== |
| |
Data z KSP lze využívat rozličným způsobem. Kromě standardní práce s konkordancemi v rozhraní KonText je možno těžit z dalších nástrojů: | Data z KSP lze využívat rozličným způsobem. Kromě standardní práce s konkordancemi v rozhraní [[https://www.korpus.cz/kontext/query?corpname=KSP|KonText]] je možno těžit z dalších nástrojů: |
| |
* [[https://trost.korpus.cz/slovo-v-poezii/|Slovo v poezii]]: nástroj vhodný pro první seznámení s korpusem, po zadání hledaného slova nabízí náhledy do dalších aplikací a řadu statistických údajů | * [[https://trost.korpus.cz/slovo-v-poezii/|Slovo v poezii]]: nástroj vhodný pro první seznámení s korpusem, po zadání hledaného slova nabízí náhledy do dalších aplikací a řadu statistických údajů |
===== Poděkování ===== | ===== Poděkování ===== |
| |
Autoři by rádi poděkovali kolegům, kteří ke zdárnému dokončení KSP opakovaně přispěli cennou radou a nezištnou pomocí: Michalu Křenovi, Václavu Cvrčkovi, Petru Plecháčovi a Robertu Kolárovi. Nemenší poděkování si zaslouží naši anotátoři z řad studentů FF UK: Šárka Kadavá, Jan Musil, Ondřej Pavlík, Milan Pavlovič, Martin Šplíchal, Lukáš Tomášek a Štěpán Truhlařík. | Autoři by rádi poděkovali kolegům, kteří ke zdárnému dokončení KSP opakovaně přispěli cennou radou a nezištnou pomocí: Michalu Křenovi, Václavu Cvrčkovi, Petru Plecháčovi a Robertu Kolárovi. Nemenší poděkování si zaslouží naši anotátoři z řad studentů FF UK: Šárka Kadavá, Tereza Marková, Barbora Mitrengová, Barbora Mlchová, Jan Musil, Ondřej Pavlík, Milan Pavlovič, Martin Šplíchal, Lukáš Tomášek a Štěpán Truhlařík. |
| |
KSP vzniká s podporou z Akademické prémie udělené Akademií věd ČR prof. Pavlu Janouškovi. Děkujeme! | KSP vzniká s podporou z Akademické prémie udělené Akademií věd ČR prof. Pavlu Janouškovi. Děkujeme! |
===== Jak citovat KSP ===== | ===== Jak citovat KSP ===== |
<WRAP round tip 70%> | <WRAP round tip 70%> |
Škrabal, M. – Piorecký, K. – Procházka, P. – Jeziorský, T.: Korpus současné poezie, verze 1.0 z 29. 6. 2022. Ústav Českého národního korpusu FF UK – Ústav pro českou literaturu AV ČR, v. v. i., Praha 2022. Dostupný z WWW http://www.korpus.cz | Piorecký, K. – Škrabal, M. – Jeziorský, T.: Korpus současné poezie, verze 2 z 13. 9. 2024. Ústav Českého národního korpusu FF UK – Ústav pro českou literaturu AV ČR, v. v. i., Praha 2024. Dostupný z WWW http://www.korpus.cz |
| |
| Škrabal, M. – Piorecký, K. – Procházka, P. – Jeziorský, T.: Korpus současné poezie, verze 1 z 29. 6. 2022. Ústav Českého národního korpusu FF UK – Ústav pro českou literaturu AV ČR, v. v. i., Praha 2022. Dostupný z WWW http://www.korpus.cz |
| |
Piorecký, K. – Škrabal, M.: Vícejazyčnost v současné české poezii. Několik úvodních postřehů z korpusové perspektivy. Slovenská literatura 6/2020, s. 568–583. | Piorecký, K. – Škrabal, M.: Vícejazyčnost v současné české poezii. Několik úvodních postřehů z korpusové perspektivy. Slovenská literatura 6/2020, s. 568–583. |
| |
Škrabal, M. – Piorecký, K.: The Corpus of Contemporary Czech Poetry: A database for research on contemporary poetic language across media. Digital Scholarship in the Humanities XX/2022, FIXME s. 1–14. https://doi.org/10.1093/llc/fqac013 | Škrabal, M. – Piorecký, K.: The Corpus of Contemporary Czech Poetry: A database for research on contemporary poetic language across media. Digital Scholarship in the Humanities 4/2022, s. 1240--1253. https://doi.org/10.1093/llc/fqac013 |
</WRAP> | </WRAP> |
| |