Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:diakorp [2015/12/18 14:33] – annazitova | cnk:diakorp [2022/08/29 18:07] – BatchEdit: pojmy>seznamy dokumenty cvrcek |
---|
| |
<WRAP right 35%> | <WRAP right 35%> |
^ <fs medium>Název</fs> ^^ <fs medium>DIAKORP verze 6</fs> ^ | ^ <fs medium>Název</fs> ^^ <fs medium>DIAKORP</fs> ^ |
^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] | 4 128 874 | | ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] | 4 128 874 | |
^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] | 3 450 142 | | ^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] | 3 450 142 | |
^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] | 282 799 | | ^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] | 282 799 | |
^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:atributy_strukturni|dokumentů]] | 116 | | ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[seznamy:strukturni_atributy_syn|dokumentů]] | 116 | |
^ Další informace ^ [[pojmy:referencni|Referenční]] | ANO | | ^ Další informace ^ [[pojmy:referencni|Referenční]] | ANO | |
^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] | NE | | ^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] | NE | |
^ ::: ^ Rok zveřejnění | 2015 | | ^ ::: ^ Aktuální verze | 6 | |
| ^ ::: ^ Rok zveřejnění | 2015 | |
</WRAP> | </WRAP> |
| |
{{:cnk:nove_slozeni_diakorpu.png?direct |}} | {{:cnk:nove_slozeni_diakorpu.png?direct |}} |
| |
== Změny oproti starší verzi == | === Změny oproti starší verzi === |
Vedle přírůstku dat (z 1,95 mil. na 3,4 mil. slovních tvarů) přibyla i klasifikace textů podle [[cnk:diakorp#anotace_textovych_typu|textových typů]]. Dále byl sjednocen formát datace a zavedeny toleranční intervaly (v případě nejasného roku vzniku byl slovní popis nahrazen číselnou hodnotou, např. "1390±10" místo "konec 14. století"). | Vedle přírůstku dat (z 1,95 mil. na 3,4 mil. slovních tvarů) přibyla i klasifikace textů podle [[cnk:diakorp#anotace_textovych_typu|textových typů]]. Dále byl sjednocen formát datace a zavedeny toleranční intervaly (v případě nejasného roku vzniku byl slovní popis nahrazen číselnou hodnotou, např. "1390±10" místo "konec 14. století"). |
| |