AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:uvod [2026/01/16 12:24] – [Přehled dostupných korpusů] michalkrencnk:uvod [2026/05/25 16:37] (aktuální) – [Přehled dostupných korpusů] michalkren
Řádek 13: Řádek 13:
 ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden také rok zveřejnění první verze.)) ^ charakteristika korpusu ^ ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden také rok zveřejnění první verze.)) ^ charakteristika korpusu ^
 | **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** |||||| | **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** ||||||
-| [[cnk:syn|SYN]] ([[cnk:syn:verze13|verze 13]]) |  5,mld. |  ✓  |  ✓  |  2010-2024  | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty |+| [[cnk:syn|SYN]] ([[cnk:syn:verze14|verze 14]]) |  5,mld. |  ✓  |  ✓  |  2010-2025  | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty |
 | [[cnk:syn2025|SYN2025]] |  100 mil. |  ✓  |  ✓  |  2025  | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2020–2024 | | [[cnk:syn2025|SYN2025]] |  100 mil. |  ✓  |  ✓  |  2025  | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2020–2024 |
 | [[cnk:syn2020|SYN2020]] |  100 mil. |  ✓  |  ✓  |  2020  | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2015–2019 | | [[cnk:syn2020|SYN2020]] |  100 mil. |  ✓  |  ✓  |  2020  | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2015–2019 |
Řádek 78: Řádek 78:
 ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^ ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^
 | [[cnk:intercorp|InterCorp]] ([[cnk:intercorp:verze16|verze 16]], [[cnk:intercorp:verze16ud|verze 16ud]]) |  5,3 mld. |  (✓)  |  (✓)  |  2008-2024  | [[pojmy:verzovany|verzovaný]] [[pojmy:paralelni|paralelní]] korpus zahrnující kromě češtiny 61 dalších jazyků | | [[cnk:intercorp|InterCorp]] ([[cnk:intercorp:verze16|verze 16]], [[cnk:intercorp:verze16ud|verze 16ud]]) |  5,3 mld. |  (✓)  |  (✓)  |  2008-2024  | [[pojmy:verzovany|verzovaný]] [[pojmy:paralelni|paralelní]] korpus zahrnující kromě češtiny 61 dalších jazyků |
 +| [[cnk:romcro|RomCro 2.0 ]] |  19,4 mil. |  ✓  |  ✓  |  2026  | [[pojmy:paralelni|paralelní]] korpus románských jazyků a chorvatštiny |
 | [[cnk:psalm77|Žalm 77]] |  10 tis. |  (✓)  |  (✓)  |  2023  | [[pojmy:paralelni|paralelní]] korpus 11 verzí textu žalmu 77 v rumunštině, církevní slovanštině a řečtině | | [[cnk:psalm77|Žalm 77]] |  10 tis. |  (✓)  |  (✓)  |  2023  | [[pojmy:paralelni|paralelní]] korpus 11 verzí textu žalmu 77 v rumunštině, církevní slovanštině a řečtině |
 | **[[cnk:struktura#cizojazycnekorpusy#paralelni|Psané srovnatelné webové korpusy]]** |||||| | **[[cnk:struktura#cizojazycnekorpusy#paralelni|Psané srovnatelné webové korpusy]]** ||||||
Řádek 104: Řádek 105:
 ====== Kdo tvoří Český národní korpus? ====== ====== Kdo tvoří Český národní korpus? ======
  
-Za tvorbou ČNK stojí **[[http://ucnk.ff.cuni.cz|Ústav Českého národního korpusu]]** ve spolupráci s **[[http://utkl.ff.cuni.cz/|Ústavem teoretické a komputační lingvistiky]]**; při budování korpusů hojně využívají nástroje vyvinuté **[[http://ufal.mff.cuni.cz/|Ústavem formální a aplikované lingvistiky]]**.+Za tvorbou ČNK stojí **[[https://ocnk.ff.cuni.cz/cs/|Oddělení Českého národního korpusu]]** Ústavu lingvistiky FF UK, při budování korpusů se hojně využívají nástroje vyvinuté **[[http://ufal.mff.cuni.cz/|Ústavem formální a aplikované lingvistiky]]**.
  
 ====== Jak lze korpusy ČNK využívat? ====== ====== Jak lze korpusy ČNK využívat? ======