Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Poslední revize Obě strany příští revize
cnk:frwac [2014/03/10 12:21]
Michal Křen [Korpus frWac]
cnk:frwac [2014/03/10 15:11]
Michal Křen [Korpus frWac]
Řádek 1: Řádek 1:
 ====== Korpus frWac ====== ====== Korpus frWac ======
-Korpus webových textů stažených z domény .fr, jeho celkový rozsah je 1,6 miliard ​slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem [[http://​www.ims.uni-stuttgart.de/projekte/corplex/​TreeTagger/​|TreeTagger]],​ podrobnější informace o vzniku korpusu najdete [[http://​wacky.sslmit.unibo.it/​doku.php?​id=corpora|zde]]. ​+Korpus webových textů stažených z domény .fr, jeho celkový rozsah je 1,35 miliardy ​slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem [[http://​www.cis.uni-muenchen.de/~schmid/tools/​TreeTagger/​|TreeTagger]],​ podrobnější informace o vzniku korpusu najdete [[http://​wacky.sslmit.unibo.it/​doku.php?​id=corpora|zde]]. ​
  
 == Jak citovat == == Jak citovat ==