Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
cnk:intercorp:verze10 [2017/12/01 14:23] – [Morfosyntaktická anotace] alexandrrosen | cnk:intercorp:verze10 [2022/08/29 18:18] (aktuální) – BatchEdit: pojmy>seznamy dokumenty IC cvrcek | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
=====Korpus InterCorp verze 10===== | =====Korpus InterCorp verze 10===== | ||
- | |||
- | <WRAP right> | ||
^ Název ^^ čeština jádro ^ čeština kolekce ^ cizí jazyky jádro ^ cizí jazyky kolekce ^ | ^ Název ^^ čeština jádro ^ čeština kolekce ^ cizí jazyky jádro ^ cizí jazyky kolekce ^ | ||
^ [[pojmy: | ^ [[pojmy: | ||
^ ::: ^ Počet [[pojmy: | ^ ::: ^ Počet [[pojmy: | ||
- | ^ [[pojmy: | + | ^ [[pojmy: |
^ ::: ^ Počet div | 1 507 | 111 672 | 3 232 | 1 841 341 | | ^ ::: ^ Počet div | 1 507 | 111 672 | 3 232 | 1 841 341 | | ||
^ ::: ^ Počet vět | 8 803 067 | 13 593 172 | 19 207 592 | 142 734 479 | | ^ ::: ^ Počet vět | 8 803 067 | 13 593 172 | 19 207 592 | 142 734 479 | | ||
Řádek 15: | Řádek 13: | ||
^ ::: ^ [[pojmy: | ^ ::: ^ [[pojmy: | ||
^ ::: ^ [[pojmy: | ^ ::: ^ [[pojmy: | ||
- | </ | ||
- | |||
====Přístup k textům==== | ====Přístup k textům==== | ||
Řádek 23: | Řádek 19: | ||
InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy: | InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy: | ||
- | Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na níže uvedenou e-mailovou adresu. | + | Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na [[martin.vavrin@ff.cuni.cz|Martina Vavřína]]. |
Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Předchozí verze jsou přitom stále dostupné; od verze 6 dál přitom budou všechny původní zůstávat stále dostupné. | Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Předchozí verze jsou přitom stále dostupné; od verze 6 dál přitom budou všechny původní zůstávat stále dostupné. | ||
Řádek 107: | Řádek 103: | ||
| uk | ukrajinština | 8 736 | 0 | 0 | 0 | 0 | 246 | 600 | 9 583 | | | uk | ukrajinština | 8 736 | 0 | 0 | 0 | 0 | 246 | 600 | 9 583 | | ||
| vi | vietnamština | 0 | 0 | 0 | 0 | 0 | 1 474 | 0 | 1 474 | | | vi | vietnamština | 0 | 0 | 0 | 0 | 0 | 1 474 | 0 | 1 474 | | ||
- | | **celkem** | | | + | | **celkem** | | |
| cs | čeština | 102 610 | 4 131 | 2 315 | 19 218 | 12 923 | 50 688 | 566 | 192 451 | | | cs | čeština | 102 610 | 4 131 | 2 315 | 19 218 | 12 923 | 50 688 | 566 | 192 451 | | ||
- | | **CELKEM** | | | + | | **CELKEM** | | |
Pozn.: U českých textů se počítají slova jen jednou za každý text, i když má více cizojazyčných protějšků. | Pozn.: U českých textů se počítají slova jen jednou za každý text, i když má více cizojazyčných protějšků. | ||
Řádek 223: | Řádek 219: | ||
* [[http:// | * [[http:// | ||
* | * | ||
- | * [[https:// | + | * [[https:// |
---- | ---- |