AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
cnk:diakorp [2015/12/18 14:33] annazitovacnk:diakorp [2021/11/29 15:17] vaclavcvrcek
Řádek 4: Řádek 4:
  
 <WRAP right 35%> <WRAP right 35%>
-^ <fs medium>Název</fs> ^^ <fs medium>DIAKORP verze 6</fs> ^ +^ <fs medium>Název</fs> ^^ <fs medium>DIAKORP</fs>
-^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] | 4 128 874 |   +^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  4 128 874 |   
-^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] | 3 450 142 |   +^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] |  3 450 142 |   
-^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] | 282 799 |   +^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  282 799 |   
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:atributy_strukturni|dokumentů]] | 116 | +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:atributy_strukturni|dokumentů]] |  116 | 
-^ Další informace ^ [[pojmy:referencni|Referenční]] | ANO    +^ Další informace ^ [[pojmy:referencni|Referenční]] |  ANO |   
-^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] | NE |   +^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE |   
-^ ::: ^ Rok zveřejnění | 2015  |+^ ::: ^ Aktuální verze |  6 | 
 +^ ::: ^ Rok zveřejnění |  2015 |
 </WRAP> </WRAP>
  
Řádek 21: Řádek 22:
   - //Dia// - připravovaný korpus zaměřený na pokrývání jednotlivých století (počínaje 19. st.) širokým spektrem textových typů, bude obsahovat ručně zkorigované a [[pojmy:lemma|lemmatizované]] texty.   - //Dia// - připravovaný korpus zaměřený na pokrývání jednotlivých století (počínaje 19. st.) širokým spektrem textových typů, bude obsahovat ručně zkorigované a [[pojmy:lemma|lemmatizované]] texty.
  
-**Složení Diakorpu verze 6 (zveřejněna 2015) v % [[pojmy:pozice|pozic]] na časové období**+=== Složení Diakorpu verze 6 (zveřejněna 2015) v % [[pojmy:pozice|pozic]] na časové období ===
  
 {{:cnk:nove_slozeni_diakorpu.png?direct |}} {{:cnk:nove_slozeni_diakorpu.png?direct |}}
  
-== Změny oproti starší verzi ==+=== Změny oproti starší verzi ==
 Vedle přírůstku dat (z 1,95 mil. na 3,4 mil. slovních tvarů) přibyla i klasifikace textů podle [[cnk:diakorp#anotace_textovych_typu|textových typů]]. Dále byl sjednocen formát datace a zavedeny toleranční intervaly (v případě nejasného roku vzniku byl slovní popis nahrazen číselnou hodnotou, např. "1390±10" místo "konec 14. století"). Vedle přírůstku dat (z 1,95 mil. na 3,4 mil. slovních tvarů) přibyla i klasifikace textů podle [[cnk:diakorp#anotace_textovych_typu|textových typů]]. Dále byl sjednocen formát datace a zavedeny toleranční intervaly (v případě nejasného roku vzniku byl slovní popis nahrazen číselnou hodnotou, např. "1390±10" místo "konec 14. století").