====== Korpus frWaC ====== Korpus webových textů stažených z domény .fr, jeho celkový rozsah je 1,35 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem [[http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/|TreeTagger]], podrobnější informace o vzniku korpusu najdete [[http://wacky.sslmit.unibo.it/doku.php?id=corpora|zde]]. ===== Jak citovat ===== A. Ferraresi, S. Bernardini, G. Picci and M. Baroni (2010) “Web Corpora for Bilingual Lexicography: A Pilot Study of English/French Collocation Extraction and Translation”. In Xiao, R. (ed.) Using Corpora in Contrastive and Translation Studies. Newcastle: Cambridge Scholars Publishing. ([[http://wacky.sslmit.unibo.it/lib/exe/fetch.php?media=ferraresi_et_al_2010.pdf|PDF ke stažení]]) ====== Související odkazy ====== [[cnk:dewac|Korpus deWaC]] • [[cnk:itwac|Korpus itWaC]] • [[cnk:ukwac|Korpus ukWaC]]