| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| cnk:intercorp:verze5 [2015/04/08 11:38] – [Morfosyntaktická anotace] vaclavcvrcek | cnk:intercorp:verze5 [2017/07/10 09:16] (aktuální) – michalskrabal |
|---|
| |
| |
| <p><b>Jádrem</b> korpusu InterCorp jsou ručně zarovnané, převážně beletristické texty. Kromě toho korpus obsahuje také nabídku automaticky zpracovaných textů, tzv. <b>kolekce</b>. Aktuálně jsou k dispozici kolekce publistických článků z webových stránek <a href="http://www.project-syndicate.org/" target="_blank">Project Syndicate</a> a <a href="http://www.presseurop.eu/" target="_blank">Presseurop</a>, a dále balíček právních textů <a href="http://langtech.jrc.it/JRC-Acquis.html" target="_blank">Acquis Communautaire</a>. Tyto texty jsou zarovnané jen automaticky, v konkordancích tedy může být více vět, které si navzájem neodpovídají.</p> | <p><b>Jádrem</b> korpusu InterCorp jsou ručně zarovnané, převážně beletristické texty. Kromě toho korpus obsahuje také nabídku automaticky zpracovaných textů, tzv. <b>kolekce</b>. Aktuálně jsou k dispozici kolekce publistických článků z webových stránek <a href="http://www.project-syndicate.org/" target="_blank">Project Syndicate</a> a <a href="http://www.presseurop.eu/" target="_blank">Presseurop</a>, a dále balíček právních textů <a href="https://ec.europa.eu/jrc/en/language-technologies/jrc-acquis" target="_blank">Acquis Communautaire</a>. Tyto texty jsou zarovnané jen automaticky, v konkordancích tedy může být více vět, které si navzájem neodpovídají.</p> |
| | |
| <p>Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnaná s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 5 z června 2012 je 91 529 000 slov v zarovnaných cizojazyčných textech v jádru a 451 112 000 slov v zarovnaných cizojazyčných textech v kolekcích, historii verzí najdete <a href="https://wiki.korpus.cz/doku.php/cnk:intercorp:historie">zde</a>. Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Velikost je udávána v milionech slov.</p> | <p>Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnaná s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 5 z června 2012 je 91 529 000 slov v zarovnaných cizojazyčných textech v jádru a 451 112 000 slov v zarovnaných cizojazyčných textech v kolekcích, historii verzí najdete <a href="https://wiki.korpus.cz/doku.php/cnk:intercorp:historie">zde</a>. Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Velikost je udávána v milionech slov.</p> |
| |
| </HTML> | </HTML> |
| ====Upozornění==== | |
| <HTML> | |
| |
| <p> | |
| Vyhledávací rozhraní Park se stále vyvíjí, je proto možné, že při hledání v korpusu narazíte na problémy nebo budete postrádat některé funkce, které znáte z vyhledávače v českém (jednojazykovém) korpusu. Popis problémů, připomínky a podněty k dalšímu vývoji rozhraní uvítáme na adrese | |
| </p> | |
| <p><img src="http://ucnk.ff.cuni.cz/intercorp/img/adresy/mava_a.gif"></p> | |
| |
| |
| </HTML> | |
| ====Poděkování==== | ====Poděkování==== |
| <HTML> | <HTML> |
| ==== Související odkazy ==== | ==== Související odkazy ==== |
| |
| <WRAP round box 60%> | <WRAP round box 50%> |
| [[cnk:intercorp|InterCorp]] • [[cnk:intercorp:verze7|Verze 7]] • [[cnk:intercorp:verze6|Verze 6]] • [[cnk:intercorp:verze4|Verze 4]] • [[cnk:intercorp:verze3|Verze 3]] • [[cnk:intercorp:historie|Historie verzí]] | [[cnk:intercorp|InterCorp]] • [[cnk:intercorp:verze7|Verze 7]] • [[cnk:intercorp:verze6|Verze 6]] • [[cnk:intercorp:verze4|Verze 4]] • [[cnk:intercorp:verze3|Verze 3]] • [[cnk:intercorp:historie|Historie verzí]] |
| </WRAP> | </WRAP> |