AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:syn:verze11 [2022/12/20 16:11] – [Struktura a anotace korpusu SYN verze 11] michalkrencnk:syn:verze11 [2023/10/11 18:08] (aktuální) – [Jak citovat SYN verze 11] jankrivan
Řádek 3: Řádek 3:
  
 <WRAP right 35%> <WRAP right 35%>
-^ <fs medium>Název</fs> ^^ <fs medium>SYN verze 9</fs> ^+^ <fs medium>Název</fs> ^^ <fs medium>SYN verze 11</fs> ^
 ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  6 067 313 960 |   ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  6 067 313 960 |  
-^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] |  4 719 008 171 |   +^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] |  5 031 922 694 |   
-^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  10 843 867 |   +^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  11 213 982 |   
-^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  7 375 002 +^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  7 509 752 
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] |  124 247 +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] |  138 186 
-^ ::: ^ Počet [[seznamy:strukturni_atributy_syn|textů]] |  17 687 333 +^ ::: ^ Počet [[seznamy:strukturni_atributy_syn|textů]] |  18 575 347 
-^ ::: ^ Počet vět |  362 174 692 |+^ ::: ^ Počet vět |  386 045 094 |
 ^ Další informace ^ [[pojmy:referencni|Referenční]] |  ANO |   ^ Další informace ^ [[pojmy:referencni|Referenční]] |  ANO |  
 ^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE (převažuje [[seznamy:txtype|publicistika]]) |   ^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE (převažuje [[seznamy:txtype|publicistika]]) |  
Řádek 61: Řádek 61:
 Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59. Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59.
  
-Křivan, J. – Šindlerová, J. (2022): [[http://sas.ujc.cas.cz/archiv.php?art=4508|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145.+Křivan, J. – Šindlerová, J. (2022): [[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145.
  
 </WRAP> </WRAP>