Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:intercorp:verze7 [2015/04/13 12:02] – [Související odkazy] vaclavcvrcek | cnk:intercorp:verze7 [2022/08/29 18:18] (aktuální) – BatchEdit: pojmy>seznamy dokumenty IC cvrcek |
---|
<WRAP right> | <WRAP right> |
^ Název ^^ čeština jádro ^ čeština kolekce ^ cizí jazyky jádro ^ cizí jazyky kolekce ^ | ^ Název ^^ čeština jádro ^ čeština kolekce ^ cizí jazyky jádro ^ cizí jazyky kolekce ^ |
^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] | 95 814 527 | 116 374 744 | 192 859 914 | 1 555 749 463 | | ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|tokenů]] | 95 814 527 | 116 374 744 | 208 845 922 | 1 546 493 833 | |
^ ::: ^ Počet [[pojmy:word|slovních tvarů]] | 77 121 760 | 88 303 155 | 160 009 304 | 1 223 656 608 | | ^ ::: ^ Počet [[pojmy:word|slovních tvarů]] | 77 121 760 | 88 303 155 | 173 224 560 | 1 216 880 655 | |
^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:atributy_strukturni|dokumentů]] | 1 184 | 5 | 2 131 | 89 | | ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[seznamy:strukturni_atributy_intercorp|dokumentů]] | 1 184 | 5 | 2 294 | 87 | |
^ ::: ^ Počet div | 1 184 | 107 388 | 2 131 | 1 818 380 | | ^ ::: ^ Počet div | 1 184 | 107 388 | 2 294 | 1 817 043 | |
^ ::: ^ Počet vět | 6 595 174 | 13 497 188 | 11 869 813 | 144 365 895 | | ^ ::: ^ Počet vět | 6 595 174 | 13 497 188 | 12 796 035 | 142 788 867 | |
^ Další informace ^ [[pojmy:referencni|referenční]] | ANO ^^^^ | ^ Další informace ^ [[pojmy:referencni|referenční]] | ANO ^^^^ |
^ ::: ^ [[pojmy:reprezentativnost|reprezentativní]] | NE ([[seznamy:txtype|různé textové typy]]) ^^^^ | ^ ::: ^ [[pojmy:reprezentativnost|reprezentativní]] | NE ([[seznamy:txtype|různé textové typy]]) ^^^^ |
^ ::: ^ rok zveřejnění | 2008 ^^^^ | ^ ::: ^ rok zveřejnění | 2014 ^^^^ |
^ ::: ^ cizích jazyků | 38 ^^^^ | ^ ::: ^ cizích jazyků | 38 ^^^^ |
^ ::: ^ [[pojmy:tag|tagovaných]] jazyků | 20 ^^^^ | ^ ::: ^ [[pojmy:tag|tagovaných]] jazyků | 20 ^^^^ |
====Přístup k textům==== | ====Přístup k textům==== |
| |
InterCorp verze 7 je přístupný přes běžný webový prohlížeč třemi způsoby z jednotného vyhledávacího rozhraní [[manualy:kontext:index|KonText]] pomocí speciálního [[kurz:hledani_v_paralelnim_korpusu|dotazovacího formuláře]] pro paralelní korpusy. | InterCorp verze 7 je přístupný přes běžný webový prohlížeč z jednotného vyhledávacího rozhraní [[manualy:kontext:index|KonText]] pomocí speciálního [[kurz:hledani_v_paralelnim_korpusu|dotazovacího formuláře]] pro paralelní korpusy. |
| |
Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na níže uvedenou e-mailovou adresu. | Texty z korpusu InterCorp lze získat po podpisu licenčního ujednání pro neziskové účely také v podobě dvojjazyčných souborů náhodně seřazených dvojic vět. Zájemci se mohou obrátit na níže uvedenou e-mailovou adresu. |
<li>publistické články a zpravodajství z webových stránek <a href="http://www.project-syndicate.org/" target="_blank">Project Syndicate</a> a <a href="http://www.presseurop.eu/" target="_blank">Presseurop</a></li> | <li>publistické články a zpravodajství z webových stránek <a href="http://www.project-syndicate.org/" target="_blank">Project Syndicate</a> a <a href="http://www.presseurop.eu/" target="_blank">Presseurop</a></li> |
| |
<li>právní texty Evropské Unie z korpusu <a href="http://langtech.jrc.it/JRC-Acquis.html" target="_blank">Acquis Communautaire</a></li> | <li>právní texty Evropské Unie z korpusu <a href="https://ec.europa.eu/jrc/en/language-technologies/jrc-acquis" target="_blank">Acquis Communautaire</a></li> |
| |
<li>zápisy jednání Evropského Parlamentu z let 2007–2011 z korpusu <a href="http://www.statmt.org/europarl/" target="_blank">Europarl</a></li> | <li>zápisy jednání Evropského Parlamentu z let 2007–2011 z korpusu <a href="http://www.statmt.org/europarl/" target="_blank">Europarl</a></li> |
| |
| |
<img src="http://ucnk.ff.cuni.cz/intercorp/img/intercorp_wordcounts2_v6.png" alt="Graf složení korpusů jednotlivých jazyků – Jádro" title="Složení korpusů jednotlivých jazyků - Jádro"/> | <img src="http://ucnk.ff.cuni.cz/intercorp/img/intercorp_wordcounts2.png" alt="Graf složení korpusů jednotlivých jazyků – Jádro" title="Složení korpusů jednotlivých jazyků - Jádro"/> |
<br/> | <br/> |
<br/> | <br/> |
<img src="http://ucnk.ff.cuni.cz/intercorp/img/intercorp_wordcounts3_v6.png" alt="Graf složení korpusů jednotlivých jazyků – Kolekce" title="Složení korpusů jednotlivých jazyků - Kolekce"/> | <img src="http://ucnk.ff.cuni.cz/intercorp/img/intercorp_wordcounts3.png" alt="Graf složení korpusů jednotlivých jazyků – Kolekce" title="Složení korpusů jednotlivých jazyků - Kolekce"/> |
| |
<br/> | <br/> |
| |
| |
====Dotazy, připomínky a podněty==== | |
<HTML> | |
| |
<p> | |
... k obsahu korpusu a podobě vyhledávacích rozhraní můžete vznést v <a href="https://podpora.korpus.cz/projects/poradna">Poradně</a> nebo na adrese | |
</p> | |
<p><img src="http://ucnk.ff.cuni.cz/intercorp/img/adresy/mava_a.gif">.</p> | |
| |
| |
</HTML> | |
====Poděkování==== | ====Poděkování==== |
<HTML> | <HTML> |