AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:intercorp:verze8 [2016/06/22 15:10] – [Jak citovat] Alexandr Rosencnk:intercorp:verze8 [2022/08/29 18:18] (aktuální) – BatchEdit: pojmy>seznamy dokumenty IC Václav Cvrček (admin)
Řádek 9: Řádek 9:
 ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] |  105 239 198 |  117 981 673 |  233 509 950 |  1 560 655 498 | ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] |  105 239 198 |  117 981 673 |  233 509 950 |  1 560 655 498 |
 ^ ::: ^ Počet [[pojmy:word|slovních tvarů]] |  84 718 325 |  89 645 545 |  194 055 340 |  1 229 043 791 | ^ ::: ^ Počet [[pojmy:word|slovních tvarů]] |  84 718 325 |  89 645 545 |  194 055 340 |  1 229 043 791 |
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:atributy_strukturni|dokumentů]] |  1 279 |  5 |  2 513 |  89 |+^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[seznamy:strukturni_atributy_intercorp|dokumentů]] |  1 279 |  5 |  2 513 |  89 |
 ^ ::: ^ Počet div |  1 279 |  111 263 |  2 513 |  1 849 184 | ^ ::: ^ Počet div |  1 279 |  111 263 |  2 513 |  1 849 184 |
 ^ ::: ^ Počet vět |  7 250 794 |  13 588 082 |  14 377 637 |  143 478 514 | ^ ::: ^ Počet vět |  7 250 794 |  13 588 082 |  14 377 637 |  143 478 514 |
Řádek 22: Řádek 22:
 ====Přístup k textům==== ====Přístup k textům====
  
-InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy:kontext:index|KonText]] pomocí speciálního [[kurz:hledani_v_paralelnim_korpusu|dotazovacího formuláře]] pro paralelní korpusy.+Po registraci na stránce [[https://www.korpus.cz/toolbar/signup.php|Prohlášení uživatele korpusů ÚČNK]] lze korpus prohledávat přes webové rozhraní. Registrace platí pro všechny veřejně přístupné korpusy ÚČNK. Máte-li uživatelské jméno a heslo k české části Českého národního korpusu, další registraci pro paralelní korpus nepotřebujete.
  
-Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět.+InterCorp je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy:kontext:index|KonText]] pomocí speciálního [[kurz:hledani_v_paralelnim_korpusu|dotazovacího formuláře]] pro paralelní korpusy.
  
-Specifikem InterCorpu je jeho inkrementální povaha: zatímco tšina ostatních korpusů ČNK jsou neměnné [[pojmy:referencni|referenční]] entity, objem textů a případně i počet jazyků a rozsah anotace se postupně zvětšuje, a to vždy s vydáním  nové verze. Starší verze InterCorpu jsou od roku 2014 zpětně dostupné.+Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na níže uvedenou e-mailovou adresu.
  
 +Obvykle jednou ročně vychází nová verze InterCorpu. V každé nové verzi roste objem textů, případně i počet jazyků a rozsah anotace. Předchozí verze jsou přitom stále dostupné; od verze 6 dál přitom budou všechny původní zůstávat stále dostupné.
 ==== Jak citovat ==== ==== Jak citovat ====
  
Řádek 49: Řádek 50:
  
   * publistické články a zpravodajství z webových stránek [[http://www.project-syndicate.org|Project Syndicate]] a [[http://www.voxeurop.eu|VoxEurop]] (dříve PressEurop)   * publistické články a zpravodajství z webových stránek [[http://www.project-syndicate.org|Project Syndicate]] a [[http://www.voxeurop.eu|VoxEurop]] (dříve PressEurop)
-  * právní texty Evropské unie z korpusu [[http://langtech.jrc.it/JRC-Acquis.html|Acquis Communautaire]]+  * právní texty Evropské unie z korpusu [[https://ec.europa.eu/jrc/en/language-technologies/jrc-acquis|Acquis Communautaire]]
   * zápisy jednání Evropského parlamentu z let 2007–2011 z korpusu [[http://www.statmt.org/europarl|Europarl]]   * zápisy jednání Evropského parlamentu z let 2007–2011 z korpusu [[http://www.statmt.org/europarl|Europarl]]
   * filmové titulky z databáze [[http://www.opensubtitles.org|OpenSubtitles]]   * filmové titulky z databáze [[http://www.opensubtitles.org|OpenSubtitles]]