Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
cnk:dewac [2014/03/10 15:08]
Michal Křen [Korpus deWaC]
cnk:dewac [2014/03/10 15:10] (aktuální)
Michal Křen [Korpus deWaC]
Řádek 1: Řádek 1:
 ====== Korpus deWaC ====== ====== Korpus deWaC ======
  
-Korpus webových textů stažených z domény .de, jeho celkový rozsah je 1,miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem [[http://​www.cis.uni-muenchen.de/​~schmid/​tools/​TreeTagger/​|TreeTagger]],​ podrobnější informace o vzniku korpusu najdete [[http://​wacky.sslmit.unibo.it/​doku.php?​id=corpora|zde]]. ​+Korpus webových textů stažených z domény .de, jeho celkový rozsah je 1,35 miliardy slov. Korpus je slovnědruhově označkován a lemmatizován nástrojem [[http://​www.cis.uni-muenchen.de/​~schmid/​tools/​TreeTagger/​|TreeTagger]],​ podrobnější informace o vzniku korpusu najdete [[http://​wacky.sslmit.unibo.it/​doku.php?​id=corpora|zde]]. ​
  
 == Jak citovat == == Jak citovat ==