Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verze | |||
cnk:ksp [2024/09/13 11:31] – [Jak citovat KSP] michalskrabal | cnk:ksp [2024/11/05 10:28] (aktuální) – [Složení korpusu] michalskrabal | ||
---|---|---|---|
Řádek 14: | Řádek 14: | ||
===== Složení korpusu ===== | ===== Složení korpusu ===== | ||
- | KSP obsahuje v tuto chvíli přibližně 37,5 milionů slov. Subkorpus tištěné poezie (print) se na tomto počtu podílí zhruba 2,7 miliony slov pocházejících z 20 498 básní otištěných ve 682 básnických sbírkách od 256 autorů. Webová složka korpusu (web) obsahuje více než 280 tisíc básní ze šestice literárních serverů (liter.cz, pismak.cz, totem.cz, libres.cz, psanci.cz, xxvi.cz), čítajících přes 34 milionů slov. Do subkorpusu print byly texty vybírány s ohledem na generační vrstevnatost současné básnické scény; aktuálně jsou tu reprezentativně zastoupeni autoři generací X a Y a tzv. baby boomers (tj. všichni narození po roce 1945); v rozšiřování korpusu pokračujeme směrem ke starším generačním vrstvám. | + | KSP obsahuje v tuto chvíli přibližně 37,5 milionů slov. Subkorpus tištěné poezie (print) se na tomto počtu podílí zhruba 2,7 miliony slov pocházejících z 27 675 básní otištěných ve 682 básnických sbírkách od 256 autorů. Webová složka korpusu (web) obsahuje více než 280 tisíc básní ze šestice literárních serverů (liter.cz, pismak.cz, totem.cz, libres.cz, psanci.cz, xxvi.cz), čítajících přes 34 milionů slov. Do subkorpusu print byly texty vybírány s ohledem na generační vrstevnatost současné básnické scény; aktuálně jsou tu reprezentativně zastoupeni autoři generací X a Y a tzv. baby boomers (tj. všichni narození po roce 1945); v rozšiřování korpusu pokračujeme směrem ke starším generačním vrstvám. |
Detaily týkající se budování KSP najdete v níže uvedených studiích. | Detaily týkající se budování KSP najdete v níže uvedených studiích. |