Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| cnk:uvod [2025/07/16 21:54] – [Přehled dostupných korpusů] michalkren | cnk:uvod [2025/10/03 18:19] (aktuální) – [Přehled dostupných korpusů] michalkren |
|---|
| | [[cnk:nkjp|NKJP_1M]] | 1 mil. | ✓ | ✓ | 2018 | ručně označkovaný milionový vzorek korpusu polštiny NKJP (//Narodowy korpus języka polskiego//) | | | [[cnk:nkjp|NKJP_1M]] | 1 mil. | ✓ | ✓ | 2018 | ručně označkovaný milionový vzorek korpusu polštiny NKJP (//Narodowy korpus języka polskiego//) | |
| | [[cnk:obc|OBC]] | 24 mil. | ✗ | ✓ | 2021 | [[http://fedora.clarin-d.uni-saarland.de/oldbailey/index.html|Old Bailey Corpus]], záznamy soudních procesů z let 1720--1913 | | | [[cnk:obc|OBC]] | 24 mil. | ✗ | ✓ | 2021 | [[http://fedora.clarin-d.uni-saarland.de/oldbailey/index.html|Old Bailey Corpus]], záznamy soudních procesů z let 1720--1913 | |
| | ^ <fs large>Korpusy generované velkými jazykovými modely (LLMs)</fs> ^^^^^^ |
| | ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^ |
| | | [[cnk:aibrown|AI Brown]] | 27 mil. | ✓ | ✓ | 2025 | žánrově pestrý korpus anglických textů vytvořených velkými jazykovými modely | |
| | | [[cnk:aikoditex|AI Koditex]] | 21 mil. | ✓ | ✓ | 2025 | žánrově pestrý korpus českých textů vytvořených velkými jazykovými modely | |
| | |
| ====== Kdo tvoří Český národní korpus? ====== | ====== Kdo tvoří Český národní korpus? ====== |
| |