Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:intercorp:verze10 [2017/12/15 21:15] – [Korpus InterCorp verze 10] Alexandr Rosen | cnk:intercorp:verze10 [2018/09/21 16:46] – [Velikost korpusu v tisících slov] úprava čísel Adrian Zasina | ||
---|---|---|---|
Řádek 19: | Řádek 19: | ||
InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy: | InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy: | ||
- | Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na níže uvedenou e-mailovou adresu. | + | Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na [[martin.vavrin@ff.cuni.cz|Martina Vavřína]]. |
Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Předchozí verze jsou přitom stále dostupné; od verze 6 dál přitom budou všechny původní zůstávat stále dostupné. | Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Předchozí verze jsou přitom stále dostupné; od verze 6 dál přitom budou všechny původní zůstávat stále dostupné. | ||
Řádek 103: | Řádek 103: | ||
| uk | ukrajinština | 8 736 | 0 | 0 | 0 | 0 | 246 | 600 | 9 583 | | | uk | ukrajinština | 8 736 | 0 | 0 | 0 | 0 | 246 | 600 | 9 583 | | ||
| vi | vietnamština | 0 | 0 | 0 | 0 | 0 | 1 474 | 0 | 1 474 | | | vi | vietnamština | 0 | 0 | 0 | 0 | 0 | 1 474 | 0 | 1 474 | | ||
- | | **celkem** | | | + | | **celkem** | | |
| cs | čeština | 102 610 | 4 131 | 2 315 | 19 218 | 12 923 | 50 688 | 566 | 192 451 | | | cs | čeština | 102 610 | 4 131 | 2 315 | 19 218 | 12 923 | 50 688 | 566 | 192 451 | | ||
- | | **CELKEM** | | | + | | **CELKEM** | | |
Pozn.: U českých textů se počítají slova jen jednou za každý text, i když má více cizojazyčných protějšků. | Pozn.: U českých textů se počítají slova jen jednou za každý text, i když má více cizojazyčných protějšků. |