Korpus lEstRepublicain
Korpus je složený ze 3 ročníků (1999, 2002 a 2003; ne všechny jsou kompletní) francouzského regionálního deníku L'Est Républicain. Ve verzi 2 obsahuje po deduplikaci téměř 73 milionů slov (verze 1 měla téměř 120 milionů slov) a byl vytvořen z dat CNRTL dostupných na adrese http://www.cnrtl.fr/corpus/estrepublicain/. Korpus je lemmatizovaný a slovnědruhově označkovaný nástrojem TreeTagger.