Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:uvod [2019/10/31 19:31] – [Přehled dostupných korpusů] alexandrrosen | cnk:uvod [2019/12/18 15:39] – michalkren |
---|
^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden rok zveřejnění první verze.)) ^ charakteristika korpusu ^ | ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden rok zveřejnění první verze.)) ^ charakteristika korpusu ^ |
| **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** |||||| | | **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** |||||| |
| [[cnk:syn|SYN]] ([[cnk:syn:verze7|verze 7]]) | 4,255 mld. | ✓ | ✓ | 2010 | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty | | | [[cnk:syn|SYN]] ([[cnk:syn:verze8|verze 8]]) | 4,5 mld. | ✓ | ✓ | 2010 | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty | |
| [[cnk:syn2015|SYN2015]] | 100 mil. | ✓ | ✓ | 2015 | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2010–2014, s novou [[cnk:klasifikace_textu_syn2015|klasifikací textů]] | | | [[cnk:syn2015|SYN2015]] | 100 mil. | ✓ | ✓ | 2015 | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2010–2014, s novou [[cnk:klasifikace_textu_syn2015|klasifikací textů]] | |
| [[cnk:syn2013PUB|SYN2013PUB]] | 935 mil. | ✓ | ✓ | 2013 | [[pojmy:referencni|referenční]] korpus publicistických textů z let 2005--2009 | | | [[cnk:syn2013PUB|SYN2013PUB]] | 935 mil. | ✓ | ✓ | 2013 | [[pojmy:referencni|referenční]] korpus publicistických textů z let 2005--2009 | |
| [[cnk:czesl-plain|CZESL-PLAIN]] | 2 mil. | ✗ | ✗ | 2012 | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích | | | [[cnk:czesl-plain|CZESL-PLAIN]] | 2 mil. | ✗ | ✗ | 2012 | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích | |
| [[cnk:czesl-sgt|CZESL-SGT]] | 960 tis. | ✓ | ✓ | 2014 | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích s metadaty a automatickou anotací| | | [[cnk:czesl-sgt|CZESL-SGT]] | 960 tis. | ✓ | ✓ | 2014 | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích s metadaty a automatickou anotací| |
| [[cnk:czesl-sgt-basic|CZESL-SGT-BASIC]] | 960 tis. | ✓ | ✓ | 2019 | korpus identický s CZESL-SGT až na omezený výběr metadat v sekci vyhledávacího rozhraní **Omezit hledání** | | | [[cnk:czesl-sgt-basic|CZESL-SGT-BASIC]] | 960 tis. | ✓ | ✓ | 2019 | korpus identický s CZESL-SGT až na omezený výběr metadat ve vyhledávacím rozhraní | |
| [[cnk:fictree|FicTree]] | 135 tis. | ✓ | ✓ | 2017 | manuálně syntaktický anotovaný korpus beletrie | | | [[cnk:fictree|FicTree]] | 135 tis. | ✓ | ✓ | 2017 | manuálně syntaktický anotovaný korpus beletrie | |
| [[cnk:fsc2000|FSC2000]] | 100 mil. | ✓ | ✗ | 2004 | upravený SYN2000, referenční zdroj Frekvenčního slovníku češtiny | | | [[cnk:fsc2000|FSC2000]] | 100 mil. | ✓ | ✗ | 2004 | upravený SYN2000, referenční zdroj Frekvenčního slovníku češtiny | |