AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:intercorp:verze13ud [2022/08/24 20:33] – [Hlavní rozdíly mezi verzemi 13 a 13ud] jankrivancnk:intercorp:verze13ud [2023/04/03 15:27] (aktuální) – [Přístup k textům] alexandrrosen
Řádek 4: Řádek 4:
 ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] |  141 124 127 |  117 877 960 |  391 209 482 |  1 518 645 852 | ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] |  141 124 127 |  117 877 960 |  391 209 482 |  1 518 645 852 |
 ^ ::: ^ Počet [[pojmy:word|slovních tvarů]] |  113 934 806 |  89 973 959 |   327 497 843 |  1 219 622 437 | ^ ::: ^ Počet [[pojmy:word|slovních tvarů]] |  113 934 806 |  89 973 959 |   327 497 843 |  1 219 622 437 |
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:atributy_strukturni|dokumentů]] |  1 657 |  30 |  3 994 |   282 |+^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[seznamy:strukturni_atributy_intercorp|dokumentů]] |  1 657 |  30 |  3 994 |   282 |
 ^ ::: ^ Počet textů |  1 657 |  111 951 |  3 994 |  1 843 528 | ^ ::: ^ Počet textů |  1 657 |  111 951 |  3 994 |  1 843 528 |
 ^ ::: ^ Počet vět |  9 782 002 |  13 606 198 |  24 318 736 |  143 196 252 | ^ ::: ^ Počet vět |  9 782 002 |  13 606 198 |  24 318 736 |  143 196 252 |
Řádek 21: Řádek 21:
 InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy:kontext:index|KonText]] pomocí speciálního [[kurz:hledani_v_paralelnim_korpusu|dotazovacího formuláře]] pro paralelní korpusy. InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy:kontext:index|KonText]] pomocí speciálního [[kurz:hledani_v_paralelnim_korpusu|dotazovacího formuláře]] pro paralelní korpusy.
  
-Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na [[martin.vavrin@ff.cuni.cz|Martina Vavřína]].+Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na [[alexandr.rosen@ff.cuni.cz|Alexandra Rosena]].
  
 Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Od verze 6 dál jsou všechny předchozí verze stále dostupné. Verzi 13, označenou 13ud, zveřejňujeme s lingvistickým značkováním podle standardu [[https://universaldependencies.org|Universal Dependencies]]. Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Od verze 6 dál jsou všechny předchozí verze stále dostupné. Verzi 13, označenou 13ud, zveřejňujeme s lingvistickým značkováním podle standardu [[https://universaldependencies.org|Universal Dependencies]].