Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
cnk:ukwac [2015/07/13 10:15]
Michal Škrabal
cnk:ukwac [2015/10/01 18:05] (aktuální)
Václav Cvrček Nadpisy a box
Řádek 3: Řádek 3:
 Korpus webových textů stažených z domény .uk, jeho celkový rozsah je 1,9 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem [[http://​www.cis.uni-muenchen.de/​~schmid/​tools/​TreeTagger/​|TreeTagger]],​ podrobnější informace o vzniku korpusu a použitém [[http://​wacky.sslmit.unibo.it/​lib/​exe/​fetch.php?​media=tagsets:​ukwac_tagset.txt|tagsetu]] najdete [[http://​wacky.sslmit.unibo.it/​doku.php?​id=corpora|zde]]. ​ Korpus webových textů stažených z domény .uk, jeho celkový rozsah je 1,9 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem [[http://​www.cis.uni-muenchen.de/​~schmid/​tools/​TreeTagger/​|TreeTagger]],​ podrobnější informace o vzniku korpusu a použitém [[http://​wacky.sslmit.unibo.it/​lib/​exe/​fetch.php?​media=tagsets:​ukwac_tagset.txt|tagsetu]] najdete [[http://​wacky.sslmit.unibo.it/​doku.php?​id=corpora|zde]]. ​
  
-== Jak citovat ==+==== Jak citovat ==== 
 +<WRAP round tip 70%>
 M. Baroni, S. Bernardini, A. Ferraresi and E. Zanchetta. 2009. The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. Language Resources and Evaluation 43(3): 209–226. ([[http://​wacky.sslmit.unibo.it/​lib/​exe/​fetch.php?​media=papers:​wacky_2008.pdf|PDF ke stažení]]) M. Baroni, S. Bernardini, A. Ferraresi and E. Zanchetta. 2009. The WaCky Wide Web: A Collection of Very Large Linguistically Processed Web-Crawled Corpora. Language Resources and Evaluation 43(3): 209–226. ([[http://​wacky.sslmit.unibo.it/​lib/​exe/​fetch.php?​media=papers:​wacky_2008.pdf|PDF ke stažení]])
 +</​WRAP>​
  
-====== Související odkazy ​======+ 
 + 
 +===== Související odkazy =====
 <WRAP round box 49%> <WRAP round box 49%>
 [[cnk:​dewac|Korpus deWaC]] • [[cnk:​frwac|Korpus frWaC]] • [[cnk:​itwac|Korpus itWaC]] [[cnk:​dewac|Korpus deWaC]] • [[cnk:​frwac|Korpus frWaC]] • [[cnk:​itwac|Korpus itWaC]]
 </​WRAP>​ </​WRAP>​