AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:intercorp:historie [2023/09/22 16:40] – [Verze 15] alexandrrosencnk:intercorp:historie [2023/10/11 17:41] (aktuální) – [Verze 16] alexandrrosen
Řádek 3: Řádek 3:
 ==== Verze 16 ==== ==== Verze 16 ====
  
-zveřejněná ??. 2023+zveřejněná 1210. 2023
  
 == Data: == == Data: ==
- +  * jádro korpusu teď obsahuje všechny texty naplánované a schválené na rok 2022 a zpracované do uzávěrky této verze 
-  * počet slov v cizojazyčných textech celkem 4 891 mil., z toho 365 mil. jádro a 4 506 mil. kolekce +  * počet slov ve všech jazycích a typech textů se zvětšil asi na trojnásobek, tj. z 1 798 mil. na 5 290 mil. 
-  * počet slov v českých textech celkem 398 mil., z toho 125 mil. jádro a 273 mil. kolekce +  * stalo se to hlavně díky aktualizaci balíčku Subtitles, který teď obsahuje 4 001 mil. slov 
-  * aktualizovali jsme balíček Subtitles, který teď obsahuje 1 784 mil. slov z celkových 3 031 mil. slov (celkem ve všech jazycích)  +  * v Subtitles a tím pádem i v celém korpusu přibylo i 20 nových jazyků – korpus teď obsahuje celkem 62 jazyků (včetně češtiny) 
-  * v balíčku Subtitles je nově také 20 nových jazyků, celkem je tedy ve verzi 16 celkem 62 jazyků   +  * počet slov v cizojazyčných textech je celkem 4 893 mil., z toho 387 mil. jádro a 4 506 mil. kolekce 
 +  * počet slov v českých textech celkem je 398 mil., z toho 125 mil. jádro a 273 mil. kolekce
   * [[cnk:intercorp:verze16|Informace o korpusu]]   * [[cnk:intercorp:verze16|Informace o korpusu]]
 +
 +
  
 ==== Verze 15 ==== ==== Verze 15 ====