Nastavení

Toto je starší verze dokumentu!


Korpus NET

Korpus NET je korpus česky psané neformální internetové komunikace. Jeho cílem je pokrýt nejen současnost ale také minulost v maximální možné míře a zachytit tak vývoj internetových jevů v čase. V současné době se skládá ze dvou základních částí: Diskusní fóra a Osobní blogy.

Diskusní fóra

Tato část představuje vzorek mezilidské komunikace. Zaměřuje se výhradně na formát diskusního fóra, zejména s použitím technologie phpBB, její součástí tedy nejsou data ze sociálních sítí ani komentáře pod články. Výběr byl vytvořen náhodnými zástupci diskusních fór, výhledově má za cíl pokrýt jejich reprezentativní část.

Texty jsou malé až střední velikosti a často velmi neformálního charakteru. Kromě základních atributů obsahují jednotlivé texty mimojiné také informaci o názvu diskusního vlákna.

Osobní blogy

Tato část pokrývá oblast neformálních textů, jejíž roli v současné době přebírají sociální sítě. Jedná se většinou o vedlejší součást zpravodajství či internetových magazínů (webové stránky s kategorií blogů), její součástí tedy nejsou firemní ani jiné formálně psané blogy. Výběr tvoří nejpopulárnější / nejfrekventovanější zástupci webových stránek.

Texty jsou střední velikosti a lehce neformálního charakteru, z toho důvodu jsou častěji formátovány do odstavců a opatřeny titulkem.