AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:intercorp:verze11 [2018/10/02 22:43] – [Strukturní atributy] alexandrrosencnk:intercorp:verze11 [2018/10/19 15:18] – grafy adrianzasina
Řádek 56: Řádek 56:
 Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnána s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 11 ze září 2018 činí 283 milionů slov v zarovnaných cizojazyčných textech v jádru a 1 225 milionů slov v zarovnaných cizojazyčných textech v kolekcích (viz [[cnk:intercorp:historie|historie verzí]]). Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Čísla v grafech ukazují velikost v milionech slov. Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnána s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 11 ze září 2018 činí 283 milionů slov v zarovnaných cizojazyčných textech v jádru a 1 225 milionů slov v zarovnaných cizojazyčných textech v kolekcích (viz [[cnk:intercorp:historie|historie verzí]]). Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Čísla v grafech ukazují velikost v milionech slov.
  
-[{{:cnk:intercorp_wordcounts_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro i kolekce}}]+[{{:cnk:intercorp:intercorp_wordcounts_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro i kolekce}}]
  
-[{{:cnk:intercorp_wordcounts2_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro}}]+[{{:cnk:intercorp:intercorp_wordcounts2_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro}}]
  
-[{{:cnk: intercorp_wordcounts3_v11.png|Skladba korpusu podle jednotlivých jazyků – kolekce}}]+[{{:cnk:intercorp:intercorp_wordcounts3_v11.png|Skladba korpusu podle jednotlivých jazyků – kolekce}}]
  
 ====Velikost korpusu v tisících slov==== ====Velikost korpusu v tisících slov====
Řádek 186: Řádek 186:
 | |text.lang_var|varieta jazyka|de-AT / de-CH / de-DE / en-AU / en-CA / en-GB / en-UM / en-US / es-ES / es-MX / es-PE / fr-BE / fr-FR / it-CH / it-IT / nl-BE / nl-NL / nn-NO / pt-BR / pt-PT / sr-Latn-RS / sy-Cyrl-RS | | |text.lang_var|varieta jazyka|de-AT / de-CH / de-DE / en-AU / en-CA / en-GB / en-UM / en-US / es-ES / es-MX / es-PE / fr-BE / fr-FR / it-CH / it-IT / nl-BE / nl-NL / nn-NO / pt-BR / pt-PT / sr-Latn-RS / sy-Cyrl-RS |
 | |text.wordcount|počet slov|číslo| | |text.wordcount|počet slov|číslo|
-|div|div.id|identifikátor oddílu (použitý v Bibli)| _NT / _OT:kapitola |+|div|div.id|identifikátor oddílu (Bible)| _NT / _OT:kapitola |
 | |div.type|typ oddílu (kapitola)|chapter| | |div.type|typ oddílu (kapitola)|chapter|
 |p|p.id|identifikátor odstavce|doc:text:div:par| |p|p.id|identifikátor odstavce|doc:text:div:par|
 |s|s.id|identifikátor věty|doc:text:div:par:sent| |s|s.id|identifikátor věty|doc:text:div:par:sent|
 |hi|hi.rend|řez písma|italic / bold / bold italic| |hi|hi.rend|řez písma|italic / bold / bold italic|
-|lb|lb.id|identifikátor verše (v Bibli)|book:chapter:verse|+|lb|lb.id|identifikátor verše (Bible)|book:chapter:verse|
 ==== Poděkování ==== ==== Poděkování ====