AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:uvod [2025/07/16 21:54] – [Přehled dostupných korpusů] michalkrencnk:uvod [2025/10/03 18:19] (aktuální) – [Přehled dostupných korpusů] michalkren
Řádek 96: Řádek 96:
 | [[cnk:nkjp|NKJP_1M]] |  1 mil. |  ✓  |  ✓  |  2018  | ručně označkovaný milionový vzorek korpusu polštiny NKJP (//Narodowy korpus języka polskiego//) | | [[cnk:nkjp|NKJP_1M]] |  1 mil. |  ✓  |  ✓  |  2018  | ručně označkovaný milionový vzorek korpusu polštiny NKJP (//Narodowy korpus języka polskiego//) |
 | [[cnk:obc|OBC]] |  24 mil. |  ✗  |  ✓  |  2021  | [[http://fedora.clarin-d.uni-saarland.de/oldbailey/index.html|Old Bailey Corpus]], záznamy soudních procesů z let 1720--1913 | | [[cnk:obc|OBC]] |  24 mil. |  ✗  |  ✓  |  2021  | [[http://fedora.clarin-d.uni-saarland.de/oldbailey/index.html|Old Bailey Corpus]], záznamy soudních procesů z let 1720--1913 |
 +^ <fs large>Korpusy generované velkými jazykovými modely (LLMs)</fs> ^^^^^^
 +^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^
 +| [[cnk:aibrown|AI Brown]] |  27 mil. |  ✓  |  ✓  |  2025  | žánrově pestrý korpus anglických textů vytvořených velkými jazykovými modely |
 +| [[cnk:aikoditex|AI Koditex]] |  21 mil. |  ✓  |  ✓  |  2025  | žánrově pestrý korpus českých textů vytvořených velkými jazykovými modely |
 +
 ====== Kdo tvoří Český národní korpus? ====== ====== Kdo tvoří Český národní korpus? ======