AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:uvod [2018/11/07 15:31] – [Přehled dostupných korpusů] michalkrencnk:uvod [2019/10/31 19:31] – [Přehled dostupných korpusů] alexandrrosen
Řádek 13: Řádek 13:
 ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden rok zveřejnění první verze.)) ^ charakteristika korpusu ^ ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění((U verzovaných korpusů, jako jsou např. [[cnk:syn|SYN]] nebo [[cnk:intercorp|InterCorp]], je uveden rok zveřejnění první verze.)) ^ charakteristika korpusu ^
 | **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** |||||| | **[[cnk:struktura#korpusypsanesoucasnecestiny(radasyn)#obecne|Obecné korpusy]]** ||||||
-| [[cnk:syn|SYN]] ([[cnk:syn:verze6|verze 6]]) |  4,033 mld. |  ✓  |  ✓  |  2010  | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty |+| [[cnk:syn|SYN]] ([[cnk:syn:verze7|verze 7]]) |  4,255 mld. |  ✓  |  ✓  |  2010  | [[pojmy:verzovany|verzovaný]] korpus, spojující synchronní psané korpusy řady SYN a další, dosud nezveřejněné texty |
 | [[cnk:syn2015|SYN2015]] |  100 mil. |  ✓  |  ✓  |  2015  | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2010–2014, s novou [[cnk:klasifikace_textu_syn2015|klasifikací textů]] | | [[cnk:syn2015|SYN2015]] |  100 mil. |  ✓  |  ✓  |  2015  | [[pojmy:referencni|referenční]] reprezentativní korpus, převažují texty z let 2010–2014, s novou [[cnk:klasifikace_textu_syn2015|klasifikací textů]] |
 | [[cnk:syn2013PUB|SYN2013PUB]] |  935 mil. |  ✓  |  ✓  |  2013  | [[pojmy:referencni|referenční]] korpus publicistických textů z let 2005--2009 | | [[cnk:syn2013PUB|SYN2013PUB]] |  935 mil. |  ✓  |  ✓  |  2013  | [[pojmy:referencni|referenční]] korpus publicistických textů z let 2005--2009 |
Řádek 24: Řádek 24:
 | [[cnk:czesl-plain|CZESL-PLAIN]] |  2 mil. |  ✗  |  ✗  |  2012  | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích | | [[cnk:czesl-plain|CZESL-PLAIN]] |  2 mil. |  ✗  |  ✗  |  2012  | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích |
 | [[cnk:czesl-sgt|CZESL-SGT]] |  960 tis. |  ✓  |  ✓  |  2014  | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích s metadaty a automatickou anotací| | [[cnk:czesl-sgt|CZESL-SGT]] |  960 tis. |  ✓  |  ✓  |  2014  | [[pojmy:zakovsky|žákovský]] korpus češtiny nerodilých mluvčích s metadaty a automatickou anotací|
 +| [[cnk:czesl-sgt-basic|CZESL-SGT-BASIC]] |  960 tis. |  ✓  |  ✓  |  2019  | korpus identický s CZESL-SGT až na omezený výběr metadat v sekci vyhledávacího rozhraní **Omezit hledání** |
 | [[cnk:fictree|FicTree]] |  135 tis. |  ✓  |  ✓  |  2017  | manuálně syntaktický anotovaný korpus beletrie | | [[cnk:fictree|FicTree]] |  135 tis. |  ✓  |  ✓  |  2017  | manuálně syntaktický anotovaný korpus beletrie |
 | [[cnk:fsc2000|FSC2000]] |  100 mil. |  ✓  |  ✗  |  2004  | upravený SYN2000, referenční zdroj Frekvenčního slovníku češtiny | | [[cnk:fsc2000|FSC2000]] |  100 mil. |  ✓  |  ✗  |  2004  | upravený SYN2000, referenční zdroj Frekvenčního slovníku češtiny |
Řádek 37: Řádek 38:
 | **Obecné korpusy** |||||| | **Obecné korpusy** ||||||
 | [[cnk:ortofon|ORTOFON]] |  1 mil. |  ✓  |  ✓  |  2017  | [[pojmy:referencni|referenční]] reprezentativní korpus neformální mluvené češtiny s dvouúrovňovou transkripcí (zahrnuje Čechy, Moravu a Slezsko) | | [[cnk:ortofon|ORTOFON]] |  1 mil. |  ✓  |  ✓  |  2017  | [[pojmy:referencni|referenční]] reprezentativní korpus neformální mluvené češtiny s dvouúrovňovou transkripcí (zahrnuje Čechy, Moravu a Slezsko) |
-| [[cnk:oral|ORAL]] |  5,4 mil. |  ✓  |  ✓  |  2017  | [[pojmy:referencni|referenční]] korpus neformální mluvené češtiny (zahrnuje Čechy, Moravu a Slezsko) |+| [[cnk:oral|ORAL]] (verze 1) |  5,4 mil. |  ✓  |  ✓  |  2017  | [[pojmy:referencni|referenční]] korpus neformální mluvené češtiny (zahrnuje Čechy, Moravu a Slezsko) |
 | [[cnk:oral2013|ORAL2013]] |  2,8 mil. |  ✗  |  ✗  |  2013  | [[pojmy:referencni|referenční]] reprezentativní korpus neformální mluvené češtiny (zahrnuje Čechy, Moravu a Slezsko) | | [[cnk:oral2013|ORAL2013]] |  2,8 mil. |  ✗  |  ✗  |  2013  | [[pojmy:referencni|referenční]] reprezentativní korpus neformální mluvené češtiny (zahrnuje Čechy, Moravu a Slezsko) |
 | [[cnk:oral2008|ORAL2008]] |  1 mil. |  ✗  |  ✗  |  2008  | [[pojmy:referencni|referenční]] sociolingvisticky vyvážený korpus neformální mluvené češtiny (zahrnuje pouze Čechy) | | [[cnk:oral2008|ORAL2008]] |  1 mil. |  ✗  |  ✗  |  2008  | [[pojmy:referencni|referenční]] sociolingvisticky vyvážený korpus neformální mluvené češtiny (zahrnuje pouze Čechy) |