Toto je starší verze dokumentu!
Korpus NET
Korpus NET je první verzí synchronního korpusu česky psané polooficiální internetové komunikace. V současné době se skládá ze dvou základních částí, diskusních fór a osobních blogů. Datové pokrytí by se však mělo s dalšími verzemi korpusu zvyšovat. Protože je cílem vzniku korpusu mapování vybraných oblastí internetové komunikace, snaží se korpus NET každou konkrétní doménu pokrýt co nejdále do minulosti a zároveň se na ni soustředit také do budoucna tak, aby další verze korpusu mohly zachycovat jejich proměnu v čase.
Diskusní fóra
Tato část korpusu se zaměřuje výhradně diskusní fóra vytvořená s použitím technologie phpBB; její součástí tedy nejsou komentáře či diskuse pod články ani data ze sociálních sítí. Výběr vzorku diskusních fór zachycených korpusem NET byl náhodný, velikost vzorku se bude výhledově zvětšovat.
Osobní blogy
Jedná se většinou o vedlejší součást zpravodajských serverů nebo internetových magazínů (webové stránky s kategorií blogů), korpus tedy nezachycuje firemní ani jiné formálně psané blogy. Výběr tvoří nejpopulárnější / nejfrekventovanější zástupci webových stránek.