Toto je starší verze dokumentu!
Korpus EEBO obsahuje více než 25 000 anglických textů z let 1475–1700, které byly zdigitalizovány v rámci projektu Early English Books Online. Celkový rozsah korpusu je přibližně 730 mil. slov.
V korpusu jsou zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.), součástí metadat jsou také odkazy na on-line verzi dané knihy.
Význam jednotlivých struktur a jejich atributů je popsán v následující tabulce:
struktura | atribut | popis |
---|---|---|
<doc> | title | název dokumentu |
<doc> | author | autor dokumentu |
<doc> | year | rok vydání (může být zadáno intervalem) |
<doc> | decade | dekáda, do níž spadá rok vydání |
<doc> | period | období, do něhož spadá rok vydání |
<doc> | biblio | |
<doc> | webSource | autor dokumentu |
<doc> | ePubSource | rok vydání (může být zadáno intervalem) |
<doc> | id | identifikátor dokumentu |
<hi> | rend | zvýraznění (řezy písma apod.) |
<l> | ||
<pb> | facs | odkaz na stránku se scanem (omezená dostupnost) |
<item> | ||
<sp> | ||
<speaker> | ||
<head> | ||
<div> | type | |
<label> | ||
<lg> | ||
<abbr> | ||
<q> | ||
<bibl> | ||
<list> | ||
<stage> | ||
<p> |