Nastavení

Toto je starší verze dokumentu!


Korpus NET

Korpus NET je první verzí synchronního korpusu česky psané polooficiální internetové komunikace. V současné době se skládá ze dvou základních částí, diskusních fór a osobních blogů; datové pokrytí by se však mělo do budoucna dále zvyšovat. Protože je cílem vzniku korpusu mapování vybraných oblastí internetové komunikace, snaží se korpus NET každou konkrétní doménu pokrýt co nejdále do minulosti a zároveň se na ni soustředit také do budoucna tak, aby další verze korpusu mohly zachycovat jejich proměnu v čase.

Diskusní fóra

Tato část se zaměřuje výhradně diskusní fóra vytvořená s použitím technologie phpBB; její součástí tedy nejsou komentáře či diskuse pod články ani data ze sociálních sítí. Výběr diskusních fór byl náhodný, výhledově má za cíl pokrýt jejich reprezentativní část.

Texty jsou malé až střední velikosti a často velmi neformálního charakteru. Kromě základních atributů obsahují jednotlivé texty mimojiné také informaci o názvu diskusního vlákna.

Osobní blogy

Tato část pokrývá oblast neformálních textů, jejíž roli v současné době přebírají sociální sítě. Jedná se většinou o vedlejší součást zpravodajství či internetových magazínů (webové stránky s kategorií blogů), její součástí tedy nejsou firemní ani jiné formálně psané blogy. Výběr tvoří nejpopulárnější / nejfrekventovanější zástupci webových stránek.

Texty jsou střední velikosti a lehce neformálního charakteru, z toho důvodu jsou častěji formátovány do odstavců a opatřeny titulkem.