AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:intercorp:verze11 [2018/10/02 22:48] – [Strukturní atributy] alexandrrosencnk:intercorp:verze11 [2018/10/19 15:38] – [Strukturní atributy] adrianzasina
Řádek 56: Řádek 56:
 Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnána s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 11 ze září 2018 činí 283 milionů slov v zarovnaných cizojazyčných textech v jádru a 1 225 milionů slov v zarovnaných cizojazyčných textech v kolekcích (viz [[cnk:intercorp:historie|historie verzí]]). Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Čísla v grafech ukazují velikost v milionech slov. Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnána s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 11 ze září 2018 činí 283 milionů slov v zarovnaných cizojazyčných textech v jádru a 1 225 milionů slov v zarovnaných cizojazyčných textech v kolekcích (viz [[cnk:intercorp:historie|historie verzí]]). Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Čísla v grafech ukazují velikost v milionech slov.
  
-[{{:cnk:intercorp_wordcounts_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro i kolekce}}]+[{{:cnk:intercorp:intercorp_wordcounts_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro i kolekce}}]
  
-[{{:cnk:intercorp_wordcounts2_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro}}]+[{{:cnk:intercorp:intercorp_wordcounts2_v11.png|Skladba korpusu podle jednotlivých jazyků – jádro}}]
  
-[{{:cnk: intercorp_wordcounts3_v11.png|Skladba korpusu podle jednotlivých jazyků – kolekce}}]+[{{:cnk:intercorp:intercorp_wordcounts3_v11.png|Skladba korpusu podle jednotlivých jazyků – kolekce}}]
  
 ====Velikost korpusu v tisících slov==== ====Velikost korpusu v tisících slov====
Řádek 159: Řádek 159:
  
 ^Struktura^Atribut^Popis^Možné hodnoty^ ^Struktura^Atribut^Popis^Možné hodnoty^
- 
 |doc|doc.id|identifikátor dokumentu| příjmení_autora-zkrácený_název_textu / _ACQUIS / _EUROPARL / _PRESSEUROP_ročník / _SUBTITLES / _SYNDICATE_ročník / _OT / _NT | |doc|doc.id|identifikátor dokumentu| příjmení_autora-zkrácený_název_textu / _ACQUIS / _EUROPARL / _PRESSEUROP_ročník / _SUBTITLES / _SYNDICATE_ročník / _OT / _NT |
 | |text.id|identifikace textu|příjmení_autora-zkrácený_název_textu:0 / _ACQUIS:číslo / _EUROPARL:číslo / _PRESSEUROP:číslo / _SUBTITLES:číslo / _SYNDICATE_ročník:název / _OT:kniha / _NT:kniha | | |text.id|identifikace textu|příjmení_autora-zkrácený_název_textu:0 / _ACQUIS:číslo / _EUROPARL:číslo / _PRESSEUROP:číslo / _SUBTITLES:číslo / _SYNDICATE_ročník:název / _OT:kniha / _NT:kniha |
Řádek 184: Řádek 183:
 | |text.volume|číslo svazku|číslo| | |text.volume|číslo svazku|číslo|
 | |text.pages|počet stran|číslo| | |text.pages|počet stran|číslo|
-| |text.lang_var|varieta jazyka|de-AT / de-CH / de-DE / en-AU / en-CA / en-GB / en-UM / en-US / es-ES / es-MX / es-PE / fr-BE / fr-FR / it-CH / it-IT / nl-BE / nl-NL / nn-NO / pt-BR / pt-PT / sr-Latn-RS / sy-Cyrl-RS |+| |text.lang_var|varieta jazyka|de-AT / de-CH / de-DE / en-AU / en-CA / en-GB / en-UM / en-US / es-ES / es-MX / es-PE / fr-BE / fr-FR / it-CH / it-IT / nl-BE / nl-NL / nn-NO / nb-NO / pt-BR / pt-PT / sr-Latn-RS / sy-Cyrl-RS |
 | |text.wordcount|počet slov|číslo| | |text.wordcount|počet slov|číslo|
 |div|div.id|identifikátor oddílu (Bible)| _NT / _OT:kapitola | |div|div.id|identifikátor oddílu (Bible)| _NT / _OT:kapitola |