AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:syn:verze11 [2022/12/20 16:09] – [Korpus SYN verze 11] michalkrencnk:syn:verze11 [2023/10/11 18:08] (aktuální) – [Jak citovat SYN verze 11] jankrivan
Řádek 3: Řádek 3:
  
 <WRAP right 35%> <WRAP right 35%>
-^ <fs medium>Název</fs> ^^ <fs medium>SYN verze 9</fs> ^+^ <fs medium>Název</fs> ^^ <fs medium>SYN verze 11</fs> ^
 ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  6 067 313 960 |   ^ [[pojmy:atributy_pozicni|Pozice]] ^ Počet [[pojmy:token|pozic (tokenů)]] |  6 067 313 960 |  
-^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] |  4 719 008 171 |   +^ ::: ^ Počet [[pojmy:token|pozic (tokenů) bez interpunkce ]] |  5 031 922 694 |   
-^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  10 843 867 |   +^ ::: ^ Počet [[pojmy:word|slovních tvarů (wordů)]] |  11 213 982 |   
-^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  7 375 002 +^ ::: ^ Počet [[pojmy:lemma|lemmat]] |  7 509 752 
-^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] |  124 247 +^ [[pojmy:atributy_strukturni|Struktury]] ^ Počet [[pojmy:doc|dokumentů]] |  138 186 
-^ ::: ^ Počet [[seznamy:strukturni_atributy_syn|textů]] |  17 687 333 +^ ::: ^ Počet [[seznamy:strukturni_atributy_syn|textů]] |  18 575 347 
-^ ::: ^ Počet vět |  362 174 692 |+^ ::: ^ Počet vět |  386 045 094 |
 ^ Další informace ^ [[pojmy:referencni|Referenční]] |  ANO |   ^ Další informace ^ [[pojmy:referencni|Referenční]] |  ANO |  
 ^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE (převažuje [[seznamy:txtype|publicistika]]) |   ^ ::: ^ [[pojmy:reprezentativnost|Reprezentativní]] |  NE (převažuje [[seznamy:txtype|publicistika]]) |  
Řádek 50: Řádek 50:
  
   * podobně jako v jiných korpusech řady SYN přibyl i v korpusu SYN verze 11 atribut ''<doc syn>'' pro [[cnk:syn#referencni_korpusy_jako_subkorpusy_v_syn|vytváření subkorpusů odpovídajících původním referenčním korpusům]];   * podobně jako v jiných korpusech řady SYN přibyl i v korpusu SYN verze 11 atribut ''<doc syn>'' pro [[cnk:syn#referencni_korpusy_jako_subkorpusy_v_syn|vytváření subkorpusů odpovídajících původním referenčním korpusům]];
-  * [[pojmy:syntakticka_analyza|syntaktická anotace]] korpusu SYN2020 byla pro SYN verze 11 nahrazena **[[seznamy:frazemy|anotací frazémovou]]**, která odpovídá korpusu SYN verze 10.+  * [[pojmy:syntakticka_analyza|syntaktická anotace]] korpusu SYN2020 byla pro SYN verze 11 nahrazena **[[seznamy:frazemy|anotací frazémovou]]**, která odpovídá korpusům SYN verze 9 a 10.
  
 ====== Jak citovat SYN verze 11 ====== ====== Jak citovat SYN verze 11 ======
Řádek 61: Řádek 61:
 Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59. Jelínek, T. – Křivan, J. – Petkevič, V. – Skoumalová, H. – Šindlerová, J. (2021): [[https://doi.org/10.1007/978-3-030-83527-9_4|SYN2020: A new corpus of Czech with an innovated annotation]]. In: K. Ekštein – F. Pártl – M. Konopík (eds.), //Text, Speech, and Dialogue.// TSD 2021. Lecture Notes in Computer Science, vol. 12848. Cham: Springer, 48–59.
  
-Křivan, J. – Šindlerová, J. (2022): [[http://sas.ujc.cas.cz/archiv.php?art=4508|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145.+Křivan, J. – Šindlerová, J. (2022): [[https://asjournals.lib.cas.cz/slovoaslovesnost/article/uuid:286197ce-8b36-43ac-9563-eba2abf8ca0e|Změny v morfologické anotaci korpusů řady SYN: nové možnosti zkoumání české gramatiky a lexikonu]]. //Slovo a slovesnost//, 83, 2/2022, 122–145.
  
 </WRAP> </WRAP>