Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
cnk:intercorp:verze3 [2015/01/29 15:14]
Michala Vacíková
cnk:intercorp:verze3 [2016/09/02 12:55] (aktuální)
Michal Škrabal [Upozornění]
Řádek 57: Řádek 57:
 </​HTML>​ </​HTML>​
 =====Korpus InterCorp verze 3===== =====Korpus InterCorp verze 3=====
-<​HTML>​ 
-  
-<p> 
-Korpus InterCorp je hlavním výstupem stejnojmenného projektu, jehož cílem je vybudovat rozsáhlý paralelní synchronní korpus pokrývající co největší množství jazyků. Na jeho tvorbě se významnou měrou podílejí pedagogové a studenti FF UK v Praze a další spolupracovníci ÚČNK. 
-</p> 
  
-<p>Po registraci na stránce <a href="​http://​korpus.cz/​prohlaseni.php">​Prohlášení uživatele korpusů ÚČNK</​a> ​ lze korpus prohledávat přes webové rozhraní. Registrace platí pro všechny veřejně přístupné korpusy ​ÚČNK. Máte-li uživatelské jméno a heslo k české části Českého národního korpusu, další registraci pro paralelní korpus nepotřebujete. +====Přístup k textům==== 
-</p>+InterCorp má v řadě korpusů budovaných v ÚČNK ​zvláštní postavení hned v několika ohledech:
  
-<​p>​InterCorp má v řadě korpusů budovaných v ÚČNK zvláštní postavení hned v několika ohledech: +  * je přístupný přes rozhraní ​KonText pomocí speciálního [[kurz:hledani_v_paralelnim_korpusu|dotazovacího formuláře]] 
-</​p>​ +  ​* ​specifikem InterCorpu je také jeho inkrementální povaha: zatímco většina ostatních korpusů ČNK jsou neměnné ​[[pojmy:​referencni|referenční]] entity, objem textů i počet jazyků zpřístupněných v korpusu InterCorp se postupně zvyšuje ​(verze jsou ovšem od roku 2014 zpětně dostupné)
- +
-<​ul><​li> ​je přístupný přes speciální ​rozhraní ​<a href="​http://​www.korpus.cz/​Park/"​ target="​_blank">​Park</​a>,​ které je naší nadstavbou nad  systémem Manatee Pavla Rychlého; stručný návod k použití Parku najdete <a href="​http://​www.korpus.cz/​intercorp/?​req=page:​manual&​amp;​lang=cs">​zde</​a>;​ autorem Parku je Michal Štourač</​li></​ul>​ +
- +
-<​ul><​li><​a href="​http://​www.korpus.cz/​corpora/​intercorp/"​ target="​_blank">​jednojazyčné</​a>​ verze všech paralelních korpusů jsou zpřístupněné pomocí webové verze rozhraní Bonito, takžje možné na korpusy jednotlivých jazyků používat standardní nástroje, jako jsou filtry, třídění,​ kolokace, frekvenční distribuce, náhodné vzorky atd.; stejně jako se všemi cizojazyčnými korpusy je navíc možné pracovat i s odpovídajícími verzemi češtiny</​li></​ul>​ +
- +
-<​ul><​li>​specifikem InterCorpu je také jeho inkrementální povaha: zatímco většina ostatních korpusů ČNK jsou neměnné referenční entity, objem textů i počet jazyků zpřístupněných v korpusu InterCorp se postupně zvyšuje</​li></​ul>​ +
- +
-</​HTML>​+
 ====Obsah korpusu==== ====Obsah korpusu====
 <​HTML>​ <​HTML>​
Řádek 87: Řádek 74:
 tabulce jsou data popisující rozsah zpřístupněné části korpusu, tabulce jsou data popisující rozsah zpřístupněné části korpusu,
 Project Syndicate představuje zhruba 1,5 až 2 milióny slov, která jsou Project Syndicate představuje zhruba 1,5 až 2 milióny slov, která jsou
-již započtena v celkovém počtu slov pro daný jazyk (stav z února 2011 ve verzi InterCorpu č. 3, historii verzí najdete <a href="http://www.korpus.cz/intercorp/?req=page:releaseNotes&​amp;​lang=cs">​zde</​a>​).</​p>​+již započtena v celkovém počtu slov pro daný jazyk (stav z února 2011 ve verzi 3, historii verzí najdete <a href="https://wiki.korpus.cz/doku.php/cnk:intercorp:​historie">​zde</​a>​).</​p>​
  
 </​HTML>​ </​HTML>​
Řádek 170: Řádek 157:
 <td align="​center"​ nowrap="​nowrap">​✔</​td>​ <td align="​center"​ nowrap="​nowrap">​✔</​td>​
 <td align="​center"​ nowrap="​nowrap">​✔</​td>​ <td align="​center"​ nowrap="​nowrap">​✔</​td>​
-<td align="​center"​ nowrap="​nowrap"><​a href="​http://​korpus.cz/​bonito/​znacky.php">​česky</​a>​ <a href="​http://​ufal.mff.cuni.cz/​pdt/​Morphology_and_Tagging/​Doc/​hmptagqr.html">​anglicky</​a>​ *)</​td>​+<td align="​center"​ nowrap="​nowrap"><​a href="​http://​wiki.korpus.cz/doku.php/​seznamy:​tagy">​česky</​a>​ <a href="​http://​ufal.mff.cuni.cz/​pdt/​Morphology_and_Tagging/​Doc/​hmptagqr.html">​anglicky</​a>​ *)</​td>​
 <td align="​center"​ nowrap="​nowrap"><​a href="​http://​ufal.mff.cuni.cz/​pdt/​Morphology_and_Tagging/​Doc/​docc0pos.ps">​anglicky</​a></​td>​ <td align="​center"​ nowrap="​nowrap"><​a href="​http://​ufal.mff.cuni.cz/​pdt/​Morphology_and_Tagging/​Doc/​docc0pos.ps">​anglicky</​a></​td>​
 <td align="​center"​ nowrap="​nowrap"><​a href="​http://​ufal.mff.cuni.cz/​morce/">​Morče</​a></​td>​ <td align="​center"​ nowrap="​nowrap"><​a href="​http://​ufal.mff.cuni.cz/​morce/">​Morče</​a></​td>​
Řádek 274: Řádek 261:
  
 </​HTML>​ </​HTML>​
-====Upozornění==== 
-<​HTML>​ 
  
-  <p> 
-Vyhledávací rozhraní Park se stále vyvíjí, je proto možné, že při hledání v korpusu narazíte na problémy nebo budete postrádat některé funkce, které znáte z vyhledávače v českém (jednojazykovém) korpusu. Popis problémů, připomínky a podněty k dalšímu vývoji rozhraní uvítáme na adrese ​ 
-</p> 
-<​p><​img src="​http://​ucnk.ff.cuni.cz/​intercorp/​img/​adresy/​mava_a.gif"></​p>​ 
- 
- 
-</​HTML>​ 
 ====Poděkování==== ====Poděkování====
 <​HTML>​ <​HTML>​
Řádek 323: Řádek 301:
  
  <ul>  <ul>
- <​li>​publicistické texty ve více jazycích z webových stránek <a href="​http://​www.project-syndicate.org/"​ target="​_blank">​Project Syndicate</​a></​li>​+ <​li>​publicistické texty ve více jazycích z webových stránek <a href="​http://​www.project-syndicate.org/"​ target="​_blank">​Project Syndicate</a> <a id="​logo"​ href="​http://​www.project-syndicate.org/"><​img class="​nodeco"​ alt="​The highest quality commentaries and analysis from distinguished voices across the world."​ title="​The highest quality commentaries and analysis from distinguished voices across the world."​ src="​http://​www.project-syndicate.org/​default/​images/​ps_logo-small.png">​</​a></​li>​
  <​li>​slovensko-české konkordance ze <a href="​http://​korpus.juls.savba.sk/"​ target="​_blank">​Slovenského národního korpusu</​a>​ </li>  <​li>​slovensko-české konkordance ze <a href="​http://​korpus.juls.savba.sk/"​ target="​_blank">​Slovenského národního korpusu</​a>​ </li>
- <​li>​povídky ve více jazycích z projektu <a href="​http://​www.goethe.de/​ins/​cz/​prj/​m89/​csindex.htm"​ target="​_blank"​>Můj rok 1989</a> z <a href="​http://​www.goethe.de/​ins/​cz/​pra/"​ target="​_blank">​Goethe Institutu</​a> ​+ <​li>​povídky ve více jazycích z projektu <i>Můj rok 1989</i> z <a href="​http://​www.goethe.de/​ins/​cz/​pra/"​ target="​_blank">​Goethe Institutu</​a> ​
  </​li><​li>​více textů v česko-litevské části korpusu od Patricka Cornesse</​li>​  </​li><​li>​více textů v česko-litevské části korpusu od Patricka Cornesse</​li>​
  <​li>​román George Orwella <​i>​1984</​i>​ ve více jazycích z korpusu <a href="​http://​nl.ijs.si/​ME/"​ target="​_blank">​Multext-East</​a></​li> ​  <​li>​román George Orwella <​i>​1984</​i>​ ve více jazycích z korpusu <a href="​http://​nl.ijs.si/​ME/"​ target="​_blank">​Multext-East</​a></​li> ​
Řádek 334: Řádek 312:
  <​li>​norské texty z nakladatelství <a href="​http://​www.aschehoug.no/"​ target="​_blank">​Aschehoug &amp; co.</​a>,​ <a href="​http://​www.cappelendamm.no/"​ target="​_blank">​Cappelen Forlag</​a>​ a <a href="​http://​www.oktober.no/"​ target="​_blank">​Forlaget Oktober</​a></​li>​  <​li>​norské texty z nakladatelství <a href="​http://​www.aschehoug.no/"​ target="​_blank">​Aschehoug &amp; co.</​a>,​ <a href="​http://​www.cappelendamm.no/"​ target="​_blank">​Cappelen Forlag</​a>​ a <a href="​http://​www.oktober.no/"​ target="​_blank">​Forlaget Oktober</​a></​li>​
  </​ul>​  </​ul>​
- 
-<a id="​logo"​ href="​http://​www.project-syndicate.org/"><​img class="​nodeco"​ alt="​The highest quality commentaries and analysis from distinguished voices across the world."​ title="​The highest quality commentaries and analysis from distinguished voices across the world."​ src="​img/​ProjectSyndycateLogo.jpg"></​a>​ 
  
 <​p>​Poslední aktualizace:​ <​i>​24. února 2011</​i></​p>​ <​p>​Poslední aktualizace:​ <​i>​24. února 2011</​i></​p>​
  
 </​HTML>​ </​HTML>​
 +
 +==== Související odkazy ====
 +
 +<WRAP round box 50%>
 +[[cnk:​intercorp|InterCorp]] • [[cnk:​intercorp:​verze7|Verze 7]] • [[cnk:​intercorp:​verze6|Verze 6]] • [[cnk:​intercorp:​verze5|Verze 5]] • [[cnk:​intercorp:​verze4|Verze 4]] • [[cnk:​intercorp:​historie|Historie verzí]]
 +</​WRAP>​
 +