AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
cnk:eebo [2025/03/17 15:51] – [EEBO (Early English Books Online)] michalkrencnk:eebo [2025/03/17 16:50] (aktuální) – [EEBO (Early English Books Online)] michalkren
Řádek 1: Řádek 1:
 ====== EEBO (Early English Books Online) ====== ====== EEBO (Early English Books Online) ======
  
-Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[http://quod.lib.umich.edu/e/eebo|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov.+Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[https://textcreationpartnership.org/tcp-texts/eebo-tcp-early-english-books-online/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov.
  
 Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je 1 300 mil. slov. Hlavním rozdílem oproti korpusu EEBO verze 1 je tedy přidání textů z druhé fáze projektu a dále zmíněná lingvistická anotace, která významně zjednodušuje jejich použití. Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je 1 300 mil. slov. Hlavním rozdílem oproti korpusu EEBO verze 1 je tedy přidání textů z druhé fáze projektu a dále zmíněná lingvistická anotace, která významně zjednodušuje jejich použití.