Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:eebo [2025/03/17 15:50] – [EEBO (Early English Books Online)] michalkren | cnk:eebo [2025/03/17 16:50] (aktuální) – [EEBO (Early English Books Online)] michalkren |
---|
====== EEBO (Early English Books Online) ====== | ====== EEBO (Early English Books Online) ====== |
| |
Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[http://quod.lib.umich.edu/e/eebo|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov. | Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[https://textcreationpartnership.org/tcp-texts/eebo-tcp-early-english-books-online/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov. |
| |
Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je 1 300 mil. slov. Hlavním rozdílem oproti verzi 1 je tedy přidání textů z fáze 2 a dále zmíněná lingvistická anotace, která významně zjednodušuje jejich použití. | Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je 1 300 mil. slov. Hlavním rozdílem oproti korpusu EEBO verze 1 je tedy přidání textů z druhé fáze projektu a dále zmíněná lingvistická anotace, která významně zjednodušuje jejich použití. |
| |
Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] a popisuje ho také následující tabulka: | Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] a popisuje ho také následující tabulka: |