Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:eebo [2015/12/18 17:40] – michalkren | cnk:eebo [2025/03/17 16:50] (aktuální) – [EEBO (Early English Books Online)] michalkren |
---|
====== EEBO (Early English Books Online) ====== | ====== EEBO (Early English Books Online) ====== |
| |
Korpus EEBO obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[http://www.textcreationpartnership.org/tcp-eebo/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov. | Korpus **EEBO verze 1** obsahuje více než 25 000 anglických textů z let 1475--1700, které byly zdigitalizovány konsorciem [[http://www.textcreationpartnership.org/|Text Creation Partnership]] v rámci projektu [[https://textcreationpartnership.org/tcp-texts/eebo-tcp-early-english-books-online/|Early English Books Online]]; proces digitalizace je podrobně popsán [[http://www.textcreationpartnership.org/docs/|zde]]. Celkový rozsah korpusu je přibližně 730 mil. slov. |
| |
| Korpus **EEBO verze 2** se skládá z 25 363 textů vytvořených během první fáze a 28 462 textů vytvořených během druhé fáze projektu [[https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/6|EEBO-TCP Partnership]]. Texty byly dále zpracovány iniciativou [[https://earlyprint.org/intros/|EarlyPrint]], konkrétně šlo o tokenizaci, standardizaci, lemmatizaci a [[https://earlyprint.org/intros/nupos_tag_set.html|slovnědruhové značkování]]. Celková velikost korpusu EEBO v2 je 1 300 mil. slov. Hlavním rozdílem oproti korpusu EEBO verze 1 je tedy přidání textů z druhé fáze projektu a dále zmíněná lingvistická anotace, která významně zjednodušuje jejich použití. |
| |
Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] a popisuje ho také následující tabulka: | Metadata a strukturace textů byly pro použití v rozhraní KonText upraveny tak, aby byly zachovány základní strukturní informace (zvýraznění textu, jeho rozčlenění apod.) včetně odkazů na on-line verzi. Význam jednotlivých struktur a jejich atributů vychází z [[http://www.tei-c.org/Vault/P5/current/doc/tei-p5-doc/en/html/|TEI P5]] a popisuje ho také následující tabulka: |
| ''<q>'' | | citace | | | ''<q>'' | | citace | |
| ''<bibl>'' | | bibliografická citace | | | ''<bibl>'' | | bibliografická citace | |
| |
| ===== Wiki kurs ===== |
| |
| Základní seznámení s korpusem //**EEBO verze 1**// a s rozhraním [[manualy:kontext:index|KonText]] získáte v krátkém kurzu o 8 lekcích (v angličtině): |
| |
| * [[en:eebo:first_query|Lesson 1 (First query)]] |
| * [[en:eebo:orthography_spelling|Lesson 2 (Orthography and Spelling)]] |
| * [[en:eebo:competing_forms|Lesson 3 (Competing forms)]] |
| * [[en:eebo:specify_query|Lesson 4 (Specify query)]] |
| * [[en:eebo:collocations|Lesson 5 (Collocations)]] |
| * [[en:eebo:morphology1|Lesson 6 (Morphology I)]] |
| * [[en:eebo:morphology2|Lesson 7 (Morphology II)]] |
| * [[en:eebo:multiword|Lesson 8 (Multiword expressions)]] |
| |
| ===== Jak citovat ===== |
| |
| <WRAP round tip 70%> |
| //EEBO: Early English Books Online, verze 1//. Ústav Českého národního korpusu FF UK, Praha 2014. Dostupné z WWW: http://www.korpus.cz |
| |
| //EEBO: Early English Books Online, verze 2 z 14. 3. 2025//. Ústav Českého národního korpusu FF UK, Praha 2025. Dostupné z WWW: http://www.korpus.cz |
| </WRAP> |
| |