AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:net [2019/12/18 13:37] – [Osobní blogy] jeziorskycnk:net [2020/11/12 11:05] – Vložena úvodní tabulka jeziorsky
Řádek 1: Řádek 1:
-~~NOTOC~~ 
- 
 ~~NOTOC~~ ~~NOTOC~~
  
 ====== Korpus NET ====== ====== Korpus NET ======
  
-Korpus NET je korpus česky psané neformální internetové komunikace. Jeho cílem je pokrýt nejen současnost ale také minulost maximální možné míře a zachytit tak vývoj internetových jevů v čase. V současné době se skládá ze dvou základních částí: [[cnk:net#diskusni_fora|Diskusní fóra]] [[cnk:net#osobni_blogy|Osobní blogy]].+<WRAP right 35%> 
 +^ <fs medium>Název</fs> ^^ <fs medium>NET</fs>
 +^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  51 733 873 |   
 +^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  1 245 717 |   
 +^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  750 650 | 
 +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> |  1 279 | 
 +^ ::: ^ Počet [[pojmy:atributy_strukturni|textů]] <text> |  267 026 | 
 +^ ::: ^ Počet odstavců <p> |  267 026 | 
 +^ ::: ^ Počet vět <s> |  2 622 636 | 
 +^ Další informace ^ [[pojmy:referencni|Referenční]] |  NE |   
 +^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE |   
 +^ ::: ^ Rok zveřejnění |  2020 | 
 +</WRAP> 
 + 
 +Korpus NET je první verzí synchronního korpusu česky psané polooficiální internetové komunikace. Korpus si neklade nároky na reprezentativnost, v současné době se skládá pouze ze dvou základních částí: diskusních fór osobních blogů. Datové pokrytí by se však mělo s dalšími verzemi korpusu zvyšovat. Protože je cílem vzniku korpusu mapování vybraných oblastí internetové komunikace, snaží se korpus NET každou konkrétní doménu pokrýt co nejdále do minulosti a zároveň se na ni soustředit také do budoucna tak, aby další verze korpusu mohly zachycovat jejich proměnu v čase.
  
 ==== Diskusní fóra ==== ==== Diskusní fóra ====
  
-Tato část představuje vzorek mezilidské komunikace. Její součástí nejsou data ze sociálních sítí ani komentáře pod články – zaměřuje se výhradně na formát diskusního fóra, zejména s použitím technologie phpBB. Texty jsou malé až střední velikosti a často velmi neformálního charakteruKromě základních atributů obsahují jednotlivé texty mimojiné také informaci o názvu diskusního vlákna.+Tato část korpusu se zaměřuje výhradně na diskusní fóra vytvořená s použitím technologie phpBB; její součástí tedy nejsou komentářči diskuse pod články ani data ze sociálních sítíVýběr vzorku diskusních fór zachycených korpusem NET byl náhodný, jeho velikost (počet diskusních fór) se bude výhledově zvětšovat.
  
 ==== Osobní blogy ==== ==== Osobní blogy ====
  
-Tato část pokrývá oblast neformálních textů, jejíž roli v současné době přebírají sociální sítě. Jedná se většinou o vedlejší součást zpravodajství či internetových magazínů (webové stránky s kategorií blogů), její součástí tedy nejsou firemní ani jiné formálně psané blogy. Výběr tvoří nejpopulárnější nejfrekventovanější zástupci webových stránek.+Jedná se většinou o vedlejší součást zpravodajských serverů nebo internetových magazínů (webové stránky s kategorií blogů). Korpus nezachycuje firemní ani jiné formálně psané blogy. 
 + 
 +===== Jak citovat ===== 
 + 
 +<WRAP round tip 70%> 
 +Jeziorský, T.: //NET: korpus polooficiální internetové komunikace//. Ústav Českého národního korpusu FF UK, Praha 2019 dostupný z: [[https://www.korpus.cz]]. 
 +</WRAP>
  
-Texty jsou střední velikosti a lehce neformálního charakteru, z toho důvodu jsou častěji formátovány do odstavců a opatřeny titulkem.