Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
cnk:intercorp:verze5 [2016/09/02 12:54]
Michal Škrabal [Upozornění]
cnk:intercorp:verze5 [2017/07/10 09:16] (aktuální)
Michal Škrabal
Řádek 69: Řádek 69:
  
  
-<​p><​b>​Jádrem</​b>​ korpusu InterCorp jsou ručně zarovnané, převážně beletristické texty. Kromě toho korpus obsahuje také nabídku automaticky zpracovaných textů, tzv. <​b>​kolekce</​b>​. Aktuálně jsou k dispozici kolekce publistických článků z webových stránek <a href="​http://​www.project-syndicate.org/"​ target="​_blank">​Project Syndicate</​a>​ a <a href="​http://​www.presseurop.eu/"​ target="​_blank">​Presseurop</​a>,​ a dále balíček právních textů <a href="http://langtech.jrc.it/JRC-Acquis.html" target="​_blank">​Acquis Communautaire</​a>​. Tyto texty jsou zarovnané jen automaticky,​ v konkordancích tedy může být více vět, které si navzájem neodpovídají.</​p> ​+<​p><​b>​Jádrem</​b>​ korpusu InterCorp jsou ručně zarovnané, převážně beletristické texty. Kromě toho korpus obsahuje také nabídku automaticky zpracovaných textů, tzv. <​b>​kolekce</​b>​. Aktuálně jsou k dispozici kolekce publistických článků z webových stránek <a href="​http://​www.project-syndicate.org/"​ target="​_blank">​Project Syndicate</​a>​ a <a href="​http://​www.presseurop.eu/"​ target="​_blank">​Presseurop</​a>,​ a dále balíček právních textů <a href="https://ec.europa.eu/jrc/​en/​language-technologies/​jrc-acquis" target="​_blank">​Acquis Communautaire</​a>​. Tyto texty jsou zarovnané jen automaticky,​ v konkordancích tedy může být více vět, které si navzájem neodpovídají.</​p> ​
     ​     ​
 <​p>​Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnaná s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 5 z června 2012 je 91 529 000 slov v zarovnaných cizojazyčných textech v jádru a 451 112 000 slov v zarovnaných cizojazyčných textech v kolekcích, historii verzí najdete <a href="​https://​wiki.korpus.cz/​doku.php/​cnk:​intercorp:​historie">​zde</​a>​. Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Velikost je udávána v milionech slov.</​p>​ <​p>​Každý cizojazyčný text má v korpusu svou českou verzi. Čeština je tedy tzv. pivot, česká verze textu (originál nebo překlad) je zarovnaná s jednou nebo více verzemi cizojazyčnými. Celkový rozsah zpřístupněné části korpusu ve verzi 5 z června 2012 je 91 529 000 slov v zarovnaných cizojazyčných textech v jádru a 451 112 000 slov v zarovnaných cizojazyčných textech v kolekcích, historii verzí najdete <a href="​https://​wiki.korpus.cz/​doku.php/​cnk:​intercorp:​historie">​zde</​a>​. Rozložení textů v rámci jádra a v jednotlivých kolekcích je znázorněno na následujících grafech. Velikost je udávána v milionech slov.</​p>​