AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:syn:verze9 [2022/03/03 15:12] – [Korpus SYN verze 9] michalkrencnk:syn:verze9 [2023/10/11 20:00] (aktuální) – [Jak citovat SYN verze 9] jankrivan
Řádek 9: Řádek 9:
 ^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  7 375 002 | ^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  7 375 002 |
 ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] |  124 247 | ^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] |  124 247 |
-^ ::: ^ Počet [[pojmy:atributy_strukturni|textů]] |  17 687 333 |+^ ::: ^ Počet [[seznamy:strukturni_atributy_syn|textů]] |  17 687 333 |
 ^ ::: ^ Počet vět |  362 174 692 | ^ ::: ^ Počet vět |  362 174 692 |
 ^ Další informace ^ [[pojmy:referencni|Referenční]] |  ANO |   ^ Další informace ^ [[pojmy:referencni|Referenční]] |  ANO |  
Řádek 47: Řádek 47:
 ====== Struktura a anotace korpusu SYN verze 9 ====== ====== Struktura a anotace korpusu SYN verze 9 ======
  
-[[pojmy:atributy_strukturni|Strukturace]] a [[pojmy:anotace|anotace]] textů korpusu SYN verze 9 vycházejí z korpusu SYN2020. [[cnk:syn2020#struktura_korpusu_syn2020_a_strukturni_znacky|Hierarchie strukturních značek]] korpusu SYN verze 9 je tedy shodná se SYN2020, stejně tak odpovídají korpusu SYN2020 také [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|lemmatizace a morfologické značkování]]. Upozorňujeme tedy, že **SYN verze 9 se v těchto ohledech liší od svého předchůdce, korpusu [[cnk:syn:verze8|SYN verze 8]].**+[[pojmy:atributy_strukturni|Strukturace]] a [[pojmy:anotace|anotace]] textů vycházejí ze SYN2020. [[cnk:syn2020#struktura_korpusu_syn2020_a_strukturni_znacky|Hierarchie strukturních značek]] korpusu SYN verze 9 je tedy shodná se SYN2020, stejně tak odpovídají korpusu SYN2020 také [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|lemmatizace a morfologické značkování]]. Upozorňujeme tedy, že **SYN verze 9 se v těchto ohledech liší od svého předchůdce, korpusu [[cnk:syn:verze8|SYN verze 8]].**
  
 Shoda struktura a anotace SYN verze 9 se [[cnk:syn2020|SYN2020]] má pouze tyto výjimky: Shoda struktura a anotace SYN verze 9 se [[cnk:syn2020|SYN2020]] má pouze tyto výjimky:
Řádek 60: Řádek 60:
  
 Hnátková, M. – Křen, M. – Procházka, P. – Skoumalová, H. (2014): [[http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf|The SYN-series corpora of written Czech]]. In //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, 160–164. Reykjavík: ELRA. ISBN 978-2-9517408-8-4. Hnátková, M. – Křen, M. – Procházka, P. – Skoumalová, H. (2014): [[http://www.lrec-conf.org/proceedings/lrec2014/pdf/294_Paper.pdf|The SYN-series corpora of written Czech]]. In //Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)//, 160–164. Reykjavík: ELRA. ISBN 978-2-9517408-8-4.
 +
 +Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59.
 +
 +Křivan, J. – Šindlerová, J. (2022): [[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145.
 +
 </WRAP> </WRAP>