Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:syn:verze10 [2022/06/09 13:16] – [Jak citovat SYN verze 10] jankrivan | cnk:syn:verze10 [2023/10/11 19:58] (aktuální) – [Jak citovat SYN verze 10] jankrivan |
---|
^ ::: ^ Počet [[pojmy:lemma|lemmat]] | 7 432 413 | | ^ ::: ^ Počet [[pojmy:lemma|lemmat]] | 7 432 413 | |
^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] | 131 383 | | ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] | 131 383 | |
^ ::: ^ Počet [[pojmy:atributy_strukturni|textů]] | 18 158 945 | | ^ ::: ^ Počet [[seznamy:strukturni_atributy_syn|textů]] | 18 158 945 | |
^ ::: ^ Počet vět | 374 658 105 | | ^ ::: ^ Počet vět | 374 658 105 | |
^ Další informace ^ [[pojmy:referencni|Referenční]] | ANO | | ^ Další informace ^ [[pojmy:referencni|Referenční]] | ANO | |
[[pojmy:atributy_strukturni|Strukturace]] a [[pojmy:anotace|anotace]] textů vycházejí ze SYN2020. [[cnk:syn2020#struktura_korpusu_syn2020_a_strukturni_znacky|Hierarchie strukturních značek]] korpusu SYN verze 10 je tedy shodná se SYN2020, stejně tak odpovídají korpusu SYN2020 také [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|lemmatizace a morfologické značkování]]. SYN verze 10 je tedy v tomto ohledu stejný jako jeho předchůdce, korpus [[cnk:syn:verze9|SYN verze 9]]. | [[pojmy:atributy_strukturni|Strukturace]] a [[pojmy:anotace|anotace]] textů vycházejí ze SYN2020. [[cnk:syn2020#struktura_korpusu_syn2020_a_strukturni_znacky|Hierarchie strukturních značek]] korpusu SYN verze 10 je tedy shodná se SYN2020, stejně tak odpovídají korpusu SYN2020 také [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|lemmatizace a morfologické značkování]]. SYN verze 10 je tedy v tomto ohledu stejný jako jeho předchůdce, korpus [[cnk:syn:verze9|SYN verze 9]]. |
| |
Shoda struktura a anotace SYN verze 10 se [[cnk:syn2020|SYN2020]] má pouze tyto výjimky: | Shoda struktury a anotace SYN verze 10 se [[cnk:syn2020|SYN2020]] má pouze tyto výjimky: |
| |
* podobně jako v jiných korpusech řady SYN je i v korpusu SYN verze 10 navíc atribut ''<doc syn>'' pro [[cnk:syn#referencni_korpusy_jako_subkorpusy_v_syn|vytváření subkorpusů odpovídajících původním referenčním korpusům]]; | * podobně jako v jiných korpusech řady SYN je i v korpusu SYN verze 10 navíc atribut ''<doc syn>'' pro [[cnk:syn#referencni_korpusy_jako_subkorpusy_v_syn|vytváření subkorpusů odpovídajících původním referenčním korpusům]]; |
| |
<WRAP round tip 70%> | <WRAP round tip 70%> |
Křen, M. – Cvrček, V. – Henyš, J. – Hnátková, M. – Jelínek, T. – Kocek, J. – Kováříková, D. – Křivan, J. – Milička, J. – Petkevič, V. – Procházka, P. – Skoumalová, H. – Šindlerová, J. – Škrabal, M.: //Korpus SYN, verze 10 z 22. 2. 2022//. Ústav Českého národního korpusu FF UK, Praha 2022. Dostupný z WWW: https://www.korpus.cz | Křen, M. – Cvrček, V. – Hnátková, M. – Jelínek, T. – Kocek, J. – Kováříková, D. – Křivan, J. – Milička, J. – Petkevič, V. – Procházka, P. – Skoumalová, H. – Šindlerová, J. – Škrabal, M.: //Korpus SYN, verze 10 z 22. 2. 2022//. Ústav Českého národního korpusu FF UK, Praha 2022. Dostupný z WWW: https://www.korpus.cz |
| |
Hnátková, M. – Křen, M. – Procházka, P. – Skoumalová, H. (2014): [[http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf|The SYN-series corpora of written Czech]]. In //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, 160–164. Reykjavík: ELRA. ISBN 978-2-9517408-8-4. | Hnátková, M. – Křen, M. – Procházka, P. – Skoumalová, H. (2014): [[http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf|The SYN-series corpora of written Czech]]. In //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, 160–164. Reykjavík: ELRA. ISBN 978-2-9517408-8-4. |
| |
Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): SYN2020: A new corpus of Czech with an innovated annotation. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59. | Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59. |
| |
Křivan, J. – Šindlerová, J. (2022): Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu. //Slovo a slovesnost//, 83, 2/2022, 122–145. | Křivan, J. – Šindlerová, J. (2022): [[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145. |
| |
</WRAP> | </WRAP> |