AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:syn:verze11 [2022/12/21 13:03] – [Korpus SYN verze 11] michalkrencnk:syn:verze11 [2026/01/22 16:21] (aktuální) – [Struktura a anotace korpusu SYN verze 11] krivan
Řádek 3: Řádek 3:
  
 <WRAP right 35%> <WRAP right 35%>
-^ <fs medium>Název</fs> ^^ <fs medium>SYN verze 9</fs> ^+^ <fs medium>Název</fs> ^^ <fs medium>SYN verze 11</fs> ^
 ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  6 067 313 960 |   ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  6 067 313 960 |  
 ^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] |  5 031 922 694 |   ^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] |  5 031 922 694 |  
Řádek 45: Řádek 45:
 ====== Struktura a anotace korpusu SYN verze 11 ====== ====== Struktura a anotace korpusu SYN verze 11 ======
  
-[[pojmy:atributy_strukturni|Strukturace]] a [[pojmy:anotace|anotace]] textů vycházejí ze SYN2020. [[cnk:syn2020#struktura_korpusu_syn2020_a_strukturni_znacky|Hierarchie strukturních značek]] korpusu SYN verze 11 je tedy shodná se SYN2020, stejně tak odpovídají korpusu SYN2020 také [[cnk:syn2020#anotace_syn2020zmeny_oproti_ostatnim_korpusum_rady_syn|lemmatizace a morfologické značkování]]. SYN verze 11 je tedy v tomto ohledu stejný jako jeho předchůdce, korpus [[cnk:syn:verze10|SYN verze 10]].+[[pojmy:atributy_strukturni|Strukturace]] a [[pojmy:anotace|anotace]] textů vycházejí ze SYN2020. [[cnk:syn2020#struktura_korpusu_syn2020_a_strukturni_znacky|Hierarchie strukturních značek]] korpusu SYN verze 13 je shodná se SYN2020. Morfologické značkovánílemmatizace a tokenizace korpusu probíhá plně automaticky podle [[cnk:anotacni_standard_cnk|anotačního standardu ČNK]]. SYN verze 11 je tedy v tomto ohledu stejný jako jeho předchůdce, korpus [[cnk:syn:verze10|SYN verze 10]].
  
 Shoda struktury a anotace SYN verze 11 se [[cnk:syn2020|SYN2020]] má pouze tyto výjimky: Shoda struktury a anotace SYN verze 11 se [[cnk:syn2020|SYN2020]] má pouze tyto výjimky:
Řádek 61: Řádek 61:
 Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59. Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59.
  
-Křivan, J. – Šindlerová, J. (2022): [[http://sas.ujc.cas.cz/archiv.php?art=4508|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145.+Křivan, J. – Šindlerová, J. (2022): [[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145.
  
 </WRAP> </WRAP>