Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:uvod [2022/01/12 21:58] – [Přehled dostupných korpusů] - IC v.14 alexandrrosen | cnk:uvod [2022/06/29 16:56] – michalskrabal |
---|
^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden také rok zveřejnění první verze.)) ^ charakteristika korpusu ^ | ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden také rok zveřejnění první verze.)) ^ charakteristika korpusu ^ |
| **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** |||||| | | **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** |||||| |
| [[cnk:syn|SYN]] ([[cnk:syn:verze9|verze 9]]) | 4,7 mld. | ✓ | ✓ | 2010-2021 | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty | | | [[cnk:syn|SYN]] ([[cnk:syn:verze9|verze 9]], [[cnk:syn:verze10|10]]) | 4,9 mld. | ✓ | ✓ | 2010-2022 | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty | |
| [[cnk:syn2020|SYN2020]] | 100 mil. | ✓ | ✓ | 2020 | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2015–2019 | | | [[cnk:syn2020|SYN2020]] | 100 mil. | ✓ | ✓ | 2020 | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2015–2019 | |
| [[cnk:syn2015|SYN2015]] | 100 mil. | ✓ | ✓ | 2015 | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2010–2014, s novou [[cnk:klasifikace_textu_syn2015|klasifikací textů]] | | | [[cnk:syn2015|SYN2015]] | 100 mil. | ✓ | ✓ | 2015 | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2010–2014, s novou [[cnk:klasifikace_textu_syn2015|klasifikací textů]] | |
| [[cnk:koditex|Koditex]] | 10,8 mil. | ✓ | ✓ | 2018 | korpus vytvořený pro účely multidimenzionální analýzy češtiny | | | [[cnk:koditex|Koditex]] | 10,8 mil. | ✓ | ✓ | 2018 | korpus vytvořený pro účely multidimenzionální analýzy češtiny | |
| [[cnk:ksk-dopisy|KSK-DOPISY]] | 800 tis. | ✗ | ✗ | 2006 | korpus soukromé korespondence: přepisy ručně psaných dopisů z let 1990–2004| | | [[cnk:ksk-dopisy|KSK-DOPISY]] | 800 tis. | ✗ | ✗ | 2006 | korpus soukromé korespondence: přepisy ručně psaných dopisů z let 1990–2004| |
| | [[cnk:ksp|KSP]] | 35,5 mil. | ✓ | ✓ | 2022 | korpus současné české poezie (publikované knižně i na literárních serverech) z let 1990–2020| |
| [[cnk:link|LINK]] | 1,8 mil. | ✓ | ✓ | 2010 | korpus sestavený z odborných lingvistických textů | | | [[cnk:link|LINK]] | 1,8 mil. | ✓ | ✓ | 2010 | korpus sestavený z odborných lingvistických textů | |
^ <fs large>[[cnk:struktura#korpusy_mluvene|Korpusy mluveného jazyka (synchronní)]]</fs> ^^^^^^ | ^ <fs large>[[cnk:struktura#korpusy_mluvene|Korpusy mluveného jazyka (synchronní)]]</fs> ^^^^^^ |