Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:online:gen1 [2022/12/22 11:03] – [Struktura korpusů] vaclavcvrcek | cnk:online:gen1 [2022/12/22 14:42] (aktuální) – [ONLINE1 (1. generace)] michalkren |
---|
====== ONLINE1 (1. generace) ====== | ====== ONLINE1 (1. generace) ====== |
| |
První generace monitorovacího korpusu **ONLINE** se snaží mapovat dynamický obsah českého internetu, tj. internetovou žurnalistiku, diskuse a sociální sítě, od roku 2017 do března 2021. Byl vytvořen v ČNK na základě dat, která laskavě poskytuje společnost **[[https://www.dataweps.com|Dataweps]]**. | První generace monitorovacího korpusu, **ONLINE1**, se snaží mapovat dynamický obsah českého internetu, tj. internetovou žurnalistiku, diskuse a sociální sítě, od roku 2017 do března 2021. Byl vytvořen v ČNK na základě dat, která laskavě poskytovala společnost **[[https://www.dataweps.com|Dataweps]]**. Tento korpus se dále neaktualizuje, časově na něj navazuje [[cnk:online:gen2|druhá generace korpusu]]. |
| |
| |
<WRAP right 35%> | <WRAP right 35%> |
^ <fs medium>Název</fs> ^^ <fs medium>ONLINE</fs> ^ | ^ <fs medium>Název</fs> ^^ <fs medium>ONLINE1</fs> ^ |
^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] | 7,053 mld. | | ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] | 7,053 mld. | |
^ ::: ^ Počet vět <s> | 563 mil. | | ^ ::: ^ Počet vět <s> | 563 mil. | |
^ Další informace ^ [[pojmy:referencni|Referenční]] | NE | | ^ Další informace ^ [[pojmy:referencni|Referenční]] | NE | |
==== media_type ==== | ==== media_type ==== |
| |
Atribut ''media_type'' je relevantní pouze pro webovou žurnalistiku (source: ''news''), kde poskytuje klasifikaci webových portálů na základě typologie vypracované týmem J. Šlerky v rámci projektu [[http://www.mapamedii.cz|Mapa medií]]. Klasifikace je vytvořena na základě preferencí čtenářů, kdy do jedné skupiny jsou sdruženy ty portály, které mají podobné publikum (viz [[http://www.mapamedii.cz/mapa/typologie/index.php|podrobný popis metody]]). Původní klasifikace byla pro účely značkování korpusu ONLINE obohacena o některé okrajové typy a počítá s následujícími položkami: | Atribut ''media_type'' je relevantní pouze pro webovou žurnalistiku (source: ''news''), kde poskytuje klasifikaci webových portálů na základě typologie vypracované týmem J. Šlerky v rámci projektu [[http://www.mapamedii.cz|Mapa medií]]. Klasifikace je vytvořena na základě preferencí čtenářů, kdy do jedné skupiny jsou sdruženy ty portály, které mají podobné publikum. Původní klasifikace byla pro účely značkování korpusu ONLINE obohacena o některé okrajové typy a počítá s následujícími položkami: |
| |
* Analyticko-investigativní | * Analyticko-investigativní |
| |
<WRAP round tip 70%> | <WRAP round tip 70%> |
Cvrček, V. – Procházka, P.: //ONLINE_NOW: monitorovací korpus internetové češtiny//. Ústav Českého národního korpusu FF UK, Praha 2020 [cit. RRRR-MM-DD((Konkrétní časový údaj v pořadí rok-měsíc-den, např. 2020-10-02))]. Dostupný z WWW: http://www.korpus.cz | Cvrček, V. – Procházka, P.: //ONLINE1: monitorovací korpus internetové češtiny//. Ústav Českého národního korpusu FF UK, Praha 2020. Dostupný z WWW: http://www.korpus.cz |
| |
Cvrček, V. – Procházka, P.: //ONLINE_ARCHIVE: monitorovací korpus internetové češtiny//. Ústav Českého národního korpusu FF UK, Praha 2020 [cit. RRRR-MM-DD]. Dostupný z WWW: http://www.korpus.cz | |
</WRAP> | </WRAP> |
| |