Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:uvod [2017/12/12 10:43] – [Přehled dostupných korpusů] michalkren | cnk:uvod [2018/08/13 15:42] – vaclavcvrcek |
---|
| [[JEROME]] | 85 mil. | ✓ | ✓ | 2013 | jednojazyčný [[pojmy:srovnatelny|srovnatelný]] korpus pro výzkum překladové češtiny | | | [[JEROME]] | 85 mil. | ✓ | ✓ | 2013 | jednojazyčný [[pojmy:srovnatelny|srovnatelný]] korpus pro výzkum překladové češtiny | |
| [[cnk:ksk-dopisy|KSK-DOPISY]] | 800 tis. | ✗ | ✗ | 2006 | Korpus soukromé korespondence: přepisy ručně psaných dopisů z let 1990–2004| | | [[cnk:ksk-dopisy|KSK-DOPISY]] | 800 tis. | ✗ | ✗ | 2006 | Korpus soukromé korespondence: přepisy ručně psaných dopisů z let 1990–2004| |
| | [[cnk:kh-dopisy|KH-DOPISY]] | 500 tis. | ✗ | ✗ | 2017 | Korpus korespondence Karla Havlíčka | |
| [[cnk:link|LINK]] | 1,8 mil. | ✓ | ✓ | 2010 | korpus sestavený z odborných lingvistických textů | | | [[cnk:link|LINK]] | 1,8 mil. | ✓ | ✓ | 2010 | korpus sestavený z odborných lingvistických textů | |
| [[cnk:orwell|ORWELL]] | 80 tis. | ✓ | ✓ | 2003 | ručně označkovaný korpus Orwellova románu [[wp>Nineteen_Eighty-Four|1984]] | | | [[cnk:orwell|ORWELL]] | 80 tis. | ✓ | ✓ | 2003 | ručně označkovaný korpus Orwellova románu [[wp>Nineteen_Eighty-Four|1984]] | |
| [[cnk:skript2012|SKRIPT2012]] | 590 tis. | ✓ | ✓ | 2013 | korpus školních písemných prací | | | [[cnk:skript2012|SKRIPT2012]] | 590 tis. | ✓ | ✓ | 2013 | korpus školních písemných prací | |
| | [[cnk:koditex|Koditex]] | 10,8 mil. | ✓ | ✓ | 2018 | korpus vytvořený pro účely multidimenzionální analýzy češtiny | |
^ <fs large>[[cnk:struktura#korpusy_mluvene|Korpusy mluveného jazyka (synchronní)]]</fs> ^^^^^^ | ^ <fs large>[[cnk:struktura#korpusy_mluvene|Korpusy mluveného jazyka (synchronní)]]</fs> ^^^^^^ |
^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^ | ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^ |
| [[cnk:eebo|EEBO]] | 730 mil. | ✗ | ✗ | 2015 | korpus anglických textů z období 1475--1700 z kolekce [[http://www.textcreationpartnership.org/tcp-eebo/|Early English Books Online]] | | | [[cnk:eebo|EEBO]] | 730 mil. | ✗ | ✗ | 2015 | korpus anglických textů z období 1475--1700 z kolekce [[http://www.textcreationpartnership.org/tcp-eebo/|Early English Books Online]] | |
| [[cnk:hotko|HOTKO]] | 36 mil. | ✗ | ✗ | 2013 | korpus horní lužické srbštiny | | | [[cnk:hotko|HOTKO]] | 36 mil. | ✗ | ✗ | 2013 | korpus horní lužické srbštiny | |
| [[cnk:lEstRepublicain|lEstRepublicain]] | 73 mil. | ✓ | ✓ | 2013 | korpus textů francouzského regionálního deníku L’Est Républicain | | | [[cnk:lEstRepublicain|lEstRepublicain]] | 73 mil. | ✓ | ✓ | 2013 | korpus textů francouzského regionálního deníku //L’Est Républicain// | |
| | [[cnk:nkjp|NKJP_1M]] | 1 mil. | ✓ | ✓ | 2018 | milionový vzorek korpusu polštiny NKJP (//Narodowy korpus języka polskiego//) | |
====== Kdo tvoří Český národní korpus? ====== | ====== Kdo tvoří Český národní korpus? ====== |
| |