| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| cnk:eebo [2025/03/17 16:50] – [EEBO (Early English Books Online)] michalkren | cnk:eebo [2025/05/28 14:36] (aktuální) – [Jak citovat] michalkren |
|---|
| ====== EEBO (Early English Books Online) ====== | ====== EEBO (Early English Books Online) ====== |
| |
| Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[https://textcreationpartnership.org/tcp-texts/eebo-tcp-early-english-books-online/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov. | Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[https://textcreationpartnership.org/tcp-texts/eebo-tcp-early-english-books-online/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně **730 mil. slov**. |
| |
| Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je 1 300 mil. slov. Hlavním rozdílem oproti korpusu EEBO verze 1 je tedy přidání textů z druhé fáze projektu a dále zmíněná lingvistická anotace, která významně zjednodušuje jejich použití. | Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je **1 300 mil. slov**. Hlavním rozdílem oproti korpusu EEBO verze 1 je tedy přidání textů z druhé fáze projektu a dále zmíněná **lingvistická anotace**, která významně zjednodušuje jejich použití. |
| |
| Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] a popisuje ho také následující tabulka: | Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] a popisuje ho také následující tabulka: |
| |
| <WRAP round tip 70%> | <WRAP round tip 70%> |
| //EEBO: Early English Books Online, verze 1//. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupné z WWW: http://www.korpus.cz | //EEBO: Early English Books Online, verze 1 z 1. 12. 2015//. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupné z WWW: http://www.korpus.cz |
| |
| //EEBO: Early English Books Online, verze 2 z 14. 3. 2025//. Ústav Českého národního korpusu FF UK, Praha 2025. Dostupné z WWW: http://www.korpus.cz | //EEBO: Early English Books Online, verze 2 z 14. 3. 2025//. Ústav lingvistiky FF UK, Praha 2025. Dostupné z WWW: http://www.korpus.cz |
| </WRAP> | </WRAP> |
| |