AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:uvod [2023/02/23 14:39] – [Přehled dostupných korpusů] michalkrencnk:uvod [2023/02/27 15:52] – [Přehled dostupných korpusů] michalkren
Řádek 48: Řádek 48:
 | [[cnk:ksp|KSP]] |  35,5 mil. |  ✓  |  ✓  |  2022  | korpus současné české poezie (publikované knižně i na literárních serverech) z let 1990–2020| | [[cnk:ksp|KSP]] |  35,5 mil. |  ✓  |  ✓  |  2022  | korpus současné české poezie (publikované knižně i na literárních serverech) z let 1990–2020|
 | [[cnk:link|LINK]] |  1,8 mil. |  ✓  |  ✓  |  2010  | korpus sestavený z odborných lingvistických textů | | [[cnk:link|LINK]] |  1,8 mil. |  ✓  |  ✓  |  2010  | korpus sestavený z odborných lingvistických textů |
-| [[cnk:totalita|Totalita]] |  12,9 mil. |  ✓  |  ✓  |  2010  | korpus veřejného segmentu jazyka komunistického režimu |+| [[cnk:totalita|Totalita]] |  12,9 mil. |  ✓  |  ✓  |  2010  | korpus psaného jazyka komunistického režimu |
 ^ <fs large>[[cnk:struktura#korpusy_mluvene|Korpusy mluveného jazyka (synchronní)]]</fs> ^^^^^^ ^ <fs large>[[cnk:struktura#korpusy_mluvene|Korpusy mluveného jazyka (synchronní)]]</fs> ^^^^^^
 ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^ ^ korpus ^ velikost (počet slov) ^ lemmatizace ^ [[pojmy:tag|morfologické značky]] ^ rok zveřejnění ^ charakteristika korpusu ^
Řádek 61: Řádek 61:
 | [[cnk:bmk|BMK]] |  490 tis. |  ✗  |  ✗  |  2002  | Brněnský mluvený korpus: přepis nahrávek brněnské mluvy z 90. let 20. století | | [[cnk:bmk|BMK]] |  490 tis. |  ✗  |  ✗  |  2002  | Brněnský mluvený korpus: přepis nahrávek brněnské mluvy z 90. let 20. století |
 | [[cnk:dialekt|DIALEKT]] (verze 2) |  223 tis. |  ✓  |  ✓  |  2017  | [[pojmy:referencni|referenční]] nářeční korpus s dvouúrovňovou transkripcí  | | [[cnk:dialekt|DIALEKT]] (verze 2) |  223 tis. |  ✓  |  ✓  |  2017  | [[pojmy:referencni|referenční]] nářeční korpus s dvouúrovňovou transkripcí  |
 +| [[cnk:jazyky-v-migraci|Jazyky v migraci]] |  294 tis. |  ✓  |  ✓  |  2022  | korpus rozhovorů (vedených v češtině a němčině) s pozdními německými vysídlenci a českými migranty z Československa do Německa o jejich jazykových biografiích |
 | [[cnk:lindsei_cz|LINDSEI_CZ]] |  120 tis. |  ✗  |  ✗  |  2017  | [[pojmy:zakovsky|žákovský]] korpus spontánní mluvené angličtiny pokročilých mluvčích s češtinou jako L1 | | [[cnk:lindsei_cz|LINDSEI_CZ]] |  120 tis. |  ✗  |  ✗  |  2017  | [[pojmy:zakovsky|žákovský]] korpus spontánní mluvené angličtiny pokročilých mluvčích s češtinou jako L1 |
 | [[cnk:pmk|PMK]] |  675 tis. |  ✗  |  ✗  |  2001  | Pražský mluvený korpus: přepis nahrávek pražské mluvy z 90. let 20. století | | [[cnk:pmk|PMK]] |  675 tis. |  ✗  |  ✗  |  2001  | Pražský mluvený korpus: přepis nahrávek pražské mluvy z 90. let 20. století |