Obsah
Zdrojové texty korpusů
Zdrojové texty synchronních korpusů
Seznamy ve formátu OpenOffice.org a MS Excel obsahují kompletní výčet opusů ve všech korpusech. Ke každému textu v korpusu jsou v tabulce uvedeny následující údaje:
- id - jednoznačný identifikátor textu
- autor - autor nebo autoři textu (je-li tato informace dostupná)
- nazev - název díla, případně číslo periodika
- rokvyd - rok vydání díla (nemusí být nutně prvním vydáním)
- srclang - zdrojový jazyk
- txtype_group - skupina textových typů
- txtype - textový typ (seznam zkratek)
- genre - tematická oblast (seznam zkratek)
- med - médium textu (seznam zkratek)
- korpus - původní zařazení textu do jednoho z referenčních korpusů SYN2000, SYN2005, SYN2006PUB, SYN2009PUB nebo SYN2010
Zdrojové texty diachronních korpusů
1)
Údaje v tabulce se od počtů, které udává korpusový manažer, mohou drobně lišit.
2)
Poznámka: Technická datace uvedená v tabulkách u korpusu Diakon odpovídá převážně roku vydání, u starých textů s nejistou datací a u textů z několikaletého časového rozmezí je vybrán jeden zástupný rok. Značná část textů byla do korpusu zařazena z jejich novějších edic, a po pravopisné stránce se může odchylovat od původního znění textu. Korpus Diakon tedy není spolehlivou základnou pro zkoumání vývoje pravopisu.