AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
cnk:intercorp:historie [2023/10/11 17:40] – [Verze 16] Alexandr Rosencnk:intercorp:historie [2023/10/11 17:41] (aktuální) – [Verze 16] Alexandr Rosen
Řádek 6: Řádek 6:
  
 == Data: == == Data: ==
-  * počet slov ve všech jazycích a typech textů se zvětšil asi na trojnásobek, tj. z 1 798 mil. na 5 290 mil., a to hlavně díky aktualizaci balíčku Subtitles, který teď obsahuje 4 001 mil. slov+  * jádro korpusu teď obsahuje všechny texty naplánované a schválené na rok 2022 a zpracované do uzávěrky této verze 
 +  * počet slov ve všech jazycích a typech textů se zvětšil asi na trojnásobek, tj. z 1 798 mil. na 5 290 mil. 
 +  * stalo se to hlavně díky aktualizaci balíčku Subtitles, který teď obsahuje 4 001 mil. slov
   * v Subtitles a tím pádem i v celém korpusu přibylo i 20 nových jazyků – korpus teď obsahuje celkem 62 jazyků (včetně češtiny)   * v Subtitles a tím pádem i v celém korpusu přibylo i 20 nových jazyků – korpus teď obsahuje celkem 62 jazyků (včetně češtiny)
   * počet slov v cizojazyčných textech je celkem 4 893 mil., z toho 387 mil. jádro a 4 506 mil. kolekce   * počet slov v cizojazyčných textech je celkem 4 893 mil., z toho 387 mil. jádro a 4 506 mil. kolekce
   * počet slov v českých textech celkem je 398 mil., z toho 125 mil. jádro a 273 mil. kolekce   * počet slov v českých textech celkem je 398 mil., z toho 125 mil. jádro a 273 mil. kolekce
-  * jádro korpusu teď obsahuje všechny texty naplánované a schválené na rok 2022 a zpracované do uzávěrky této verze 
   * [[cnk:intercorp:verze16|Informace o korpusu]]   * [[cnk:intercorp:verze16|Informace o korpusu]]