Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
cnk:net [2020/11/12 11:05]
Tomáš Jeziorský Vložena úvodní tabulka
cnk:net [2021/02/10 14:28] (aktuální)
Michal Křen [Verze 2]
Řádek 3: Řádek 3:
 ====== Korpus NET ====== ====== Korpus NET ======
  
-<WRAP right 35%> +<WRAP right 45%> 
-^ <fs medium>Název</fs> ^^ <fs medium>NET</fs>+^ <fs medium>Název</fs> ^^ <fs medium>NET</fs> ^ <fs medium>NET v2</fs> ^ 
-^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  51 733 873 |   +^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  51 733 873 |  176 365 880 | 
-^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  1 245 717 |   +^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  1 245 717 |  2 637 707 | 
-^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  750 650 | +^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  750 650 |  1 744 001 
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> |  1 279 | +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] <doc> |  1 279 |  12 738 
-^ ::: ^ Počet [[pojmy:atributy_strukturni|textů]] <text> |  267 026 | +^ ::: ^ Počet [[pojmy:atributy_strukturni|textů]] <text> |  267 026 |  1 817 088 
-^ ::: ^ Počet odstavců <p> |  267 026 | +^ ::: ^ Počet odstavců <p> |  267 026 |  1 817 088 
-^ ::: ^ Počet vět <s> |  2 622 636 | +^ ::: ^ Počet vět <s> |  2 622 636 |  8 905 016 
-^ Další informace ^ [[pojmy:referencni|Referenční]] |  NE |   +^ Další informace ^ [[pojmy:referencni|Referenční]] |  NE |  NE | 
-^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE |   +^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE |  NE | 
-^ ::: ^ Rok zveřejnění |  2020 |+^ ::: ^ Rok zveřejnění |  2019 |  2021 |
 </WRAP> </WRAP>
  
Řádek 26: Řádek 26:
  
 Jedná se většinou o vedlejší součást zpravodajských serverů nebo internetových magazínů (webové stránky s kategorií blogů). Korpus nezachycuje firemní ani jiné formálně psané blogy. Jedná se většinou o vedlejší součást zpravodajských serverů nebo internetových magazínů (webové stránky s kategorií blogů). Korpus nezachycuje firemní ani jiné formálně psané blogy.
 +
 +===== Verze 2 (2021) =====
 +
 +Korpus NET ve verzi 2 prošel změnou zejména po obsahové stránce. Přidána byla aktualizovaná data za rok 2020, značně se také zvýšil počet stahovaných blogů a diskusních fór (aktuálně více než 120 domén), a tím také pokrytí korpusových dat.
  
 ===== Jak citovat ===== ===== Jak citovat =====
  
 <WRAP round tip 70%> <WRAP round tip 70%>
-Jeziorský, T.: //NET: korpus polooficiální internetové komunikace//. Ústav Českého národního korpusu FF UK, Praha 2019 dostupný z: [[https://www.korpus.cz]].+Jeziorský, T.: //NET v1: korpus polooficiální internetové komunikace//. Ústav Českého národního korpusu FF UK, Praha 2019 dostupný z: [[https://www.korpus.cz]]. 
 + 
 +Jeziorský, T.: //NET v2: korpus polooficiální internetové komunikace//. Ústav Českého národního korpusu FF UK, Praha 2021 dostupný z: [[https://www.korpus.cz]]. 
 </WRAP> </WRAP>