AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:eebo [2015/12/18 17:38] michalkrencnk:eebo [2025/03/17 16:50] (aktuální) – [EEBO (Early English Books Online)] michalkren
Řádek 1: Řádek 1:
 ====== EEBO (Early English Books Online) ====== ====== EEBO (Early English Books Online) ======
  
-Korpus EEBO obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[http://www.textcreationpartnership.org/tcp-eebo/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov.+Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[https://textcreationpartnership.org/tcp-texts/eebo-tcp-early-english-books-online/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov.
  
-Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi dané knihy. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] je popsán v následující tabulce:+Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je 1 300 mil. slov. Hlavním rozdílem oproti korpusu EEBO verze 1 je tedy přidání textů z druhé fáze projektu a dále zmíněná lingvistická anotace, která významně zjednodušuje jejich použití. 
 + 
 +Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] a popisuje ho také následující tabulka:
  
 ^ struktura ^ atribut ^ popis ^ ^ struktura ^ atribut ^ popis ^
Řádek 31: Řádek 33:
 | ''<q>'' |  | citace | | ''<q>'' |  | citace |
 | ''<bibl>'' |  | bibliografická citace | | ''<bibl>'' |  | bibliografická citace |
 +
 +===== Wiki kurs =====
 +
 +Základní seznámení s korpusem //**EEBO verze 1**// a s rozhraním [[manualy:kontext:index|KonText]] získáte v krátkém kurzu o 8 lekcích (v angličtině):
 +
 +  * [[en:eebo:first_query|Lesson 1 (First query)]]
 +  * [[en:eebo:orthography_spelling|Lesson 2 (Orthography and Spelling)]]
 +  * [[en:eebo:competing_forms|Lesson 3 (Competing forms)]]
 +  * [[en:eebo:specify_query|Lesson 4 (Specify query)]]
 +  * [[en:eebo:collocations|Lesson 5 (Collocations)]]
 +  * [[en:eebo:morphology1|Lesson 6 (Morphology I)]]
 +  * [[en:eebo:morphology2|Lesson 7 (Morphology II)]]
 +  * [[en:eebo:multiword|Lesson 8 (Multiword expressions)]]
 +
 +===== Jak citovat =====
 +
 +<WRAP round tip 70%>
 +//EEBO: Early English Books Online, verze 1//. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupné z WWW: http://www.korpus.cz
 +
 +//EEBO: Early English Books Online, verze 2 z 14. 3. 2025//. Ústav Českého národního korpusu FF UK, Praha 2025. Dostupné z WWW: http://www.korpus.cz
 +</WRAP>