Toto je starší verze dokumentu!
Korpus EEBO obsahuje více než 25 000 anglických textů z let 1475–1700, které byly zdigitalizovány konsorciem Text Creation Partnership v rámci projektu Early English Books Online; proces digitalizace je podrobně popsán zde. Celkový rozsah korpusu je přibližně 730 mil. slov.
Strukturace textů a jejich metadata byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi dané knihy. Význam jednotlivých struktur a jejich atributů je popsán v následující tabulce:
struktura | atribut | popis |
---|---|---|
<doc> | title | název dokumentu |
<doc> | author | autor dokumentu |
<doc> | year | rok vydání (může být zadáno intervalem) |
<doc> | decade | dekáda, do níž spadá rok vydání |
<doc> | period | období, do něhož spadá rok vydání |
<doc> | biblio | |
<doc> | webSource | odkaz na plný text ve formátu HTML |
<doc> | ePubSource | odkaz na plný text ve formátu ePUB |
<doc> | id | identifikátor dokumentu |
<hi> | rend | zvýraznění (řezy písma apod.) |
<l> | ||
<pb> | facs | odkaz na stránku se scanem (omezená dostupnost) |
<item> | ||
<sp> | ||
<speaker> | ||
<head> | ||
<div> | type | |
<label> | ||
<lg> | ||
<abbr> | ||
<q> | ||
<bibl> | ||
<list> | ||
<stage> | ||
<p> |