Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:intercorp:verze16ud [2024/10/11 10:50] – [Velikost korpusu podle jazyků] alexandrrosen | cnk:intercorp:verze16ud [2024/10/18 20:33] (aktuální) – [Odkazy – o korpusu InterCorp s anotací podle UD] alexandrrosen |
---|
^:::|Core-misc| 2| 2| 3,5| 44,4| 52,2| 733,0| 532,9| 12,820| 2,148| 1,051| 4,791| 1,821| 2,385| | ^:::|Core-misc| 2| 2| 3,5| 44,4| 52,2| 733,0| 532,9| 12,820| 2,148| 1,051| 4,791| 1,821| 2,385| |
^:::|Acquis| 1| 18 563| 1 310,5| 15 264,2| 19 702,1| 556,9| 380,4| 13,209| 2,369| 0,886| 6,990| 2,588| 2,647| | ^:::|Acquis| 1| 18 563| 1 310,5| 15 264,2| 19 702,1| 556,9| 380,4| 13,209| 2,369| 0,886| 6,990| 2,588| 2,647| |
^[[https://www.loc.gov/standards/iso639-2/php/langcodes_name.php?iso_639_1=fi|fi]]|Bible| 2| 66| 48,0| 542,6| 675,3| 529,0| 351,4| 13,324| 1,911| 0,871| 4,231| 1,534| 2,511| | ^:::|Bible| 2| 66| 48,0| 542,6| 675,3| 529,0| 351,4| 13,324| 1,911| 0,871| 4,231| 1,534| 2,511| |
^:::|Europarl| 1| 67 019| 675,6| 10 109,3| 11 838,6| 670,8| 462,7| 15,260| 2,483| 1,242| 6,924| 2,670| 2,395| | ^:::|Europarl| 1| 67 019| 675,6| 10 109,3| 11 838,6| 670,8| 462,7| 15,260| 2,483| 1,242| 6,924| 2,670| 2,395| |
^:::|Subtitles| 1| 30 900| 23 262,2| 90 481,8| 124 969,7| 666,5| 444,7| 3,909| 1,244| 0,242| 1,404| 0,513| 1,689| | ^:::|Subtitles| 1| 30 900| 23 262,2| 90 481,8| 124 969,7| 666,5| 444,7| 3,909| 1,244| 0,242| 1,404| 0,513| 1,689| |
^:::|PressEurop| 7| 6 991| 160,6| 2 725,2| 3 192,6| 546,7| 429,5| 17,486| 2,219| 1,017| 8,508| 2,772| 2,492| | ^:::|PressEurop| 7| 6 991| 160,6| 2 725,2| 3 192,6| 546,7| 429,5| 17,486| 2,219| 1,017| 8,508| 2,772| 2,492| |
^:::|Subtitles| 1| 45 407| 38 108,1| 211 310,4| 266 731,5| 509,0| 351,2| 5,572| 1,388| 0,383| 2,129| 0,795| 1,954| | ^:::|Subtitles| 1| 45 407| 38 108,1| 211 310,4| 266 731,5| 509,0| 351,2| 5,572| 1,388| 0,383| 2,129| 0,795| 1,954| |
^:::|Core-nonfict| 10| 10| 30,6| 518,7| 625,2| 645,0| 495,9| 17,765| 2,613| 1,223| 8,126| 2,801| 2,603| | ^[[https://www.loc.gov/standards/iso639-2/php/langcodes_name.php?iso_639_1=ru|ru]]|Core-nonfict| 10| 10| 30,6| 518,7| 625,2| 645,0| 495,9| 17,765| 2,613| 1,223| 8,126| 2,801| 2,603| |
^:::|Core-fiction| 144| 144| 1 043,5| 11 757,6| 14 913,7| 633,0| 501,9| 11,643| 1,959| 0,865| 4,203| 1,557| 2,386| | ^:::|Core-fiction| 144| 144| 1 043,5| 11 757,6| 14 913,7| 633,0| 501,9| 11,643| 1,959| 0,865| 4,203| 1,557| 2,386| |
^:::|Core-misc| 6| 6| 12,8| 143,8| 180,7| 633,2| 484,5| 11,439| 1,947| 0,870| 4,378| 1,718| 2,265| | ^:::|Core-misc| 6| 6| 12,8| 143,8| 180,7| 633,2| 484,5| 11,439| 1,947| 0,870| 4,378| 1,718| 2,265| |
| |
Olga Nádvorníková a Alexandr Rosen (2024): Vyhledávání v paralelním korpusu za použití anotace Universal Dependencies. [[https://www.youtube.com/watch?v=5l5Vbb1eQDw&t=190s|Záznam workshopu]] z 17. 9. 2024, doprovodné akce [[https://bcl2024.ff.cuni.cz|Bienále české lingvistiky 2024]], viz též [[https://jakobson.korpus.cz/~rosen/BCL2024/P18_SLIDES/Prezentace_Bienale2024_WorkShop.pdf|prezentace]]. | Olga Nádvorníková a Alexandr Rosen (2024): Vyhledávání v paralelním korpusu za použití anotace Universal Dependencies. [[https://www.youtube.com/watch?v=5l5Vbb1eQDw&t=190s|Záznam workshopu]] z 17. 9. 2024, doprovodné akce [[https://bcl2024.ff.cuni.cz|Bienále české lingvistiky 2024]], viz též [[https://jakobson.korpus.cz/~rosen/BCL2024/P18_SLIDES/Prezentace_Bienale2024_WorkShop.pdf|prezentace]]. |
| |
| Alexandr Rosen (2024): Lexical and syntactic variability |
| of languages and text genres – a corpus-based study. [[https://www.youtube.com/watch?v=E2ujmqt7Q2E|Záznam přednášky]] ze 14. 10. 2024, [[https://zil.ipipan.waw.pl/seminarium|Seminarium „Przetwarzanie języka naturalnego”]] [[https://zil.ipipan.waw.pl|Zespołu Inżynierii Lingwistycznej]] w [[https://ipipan.waw.pl|Instytucie Podstaw Informatyki]] [[https://pan.pl|Polskiej Akademii Nauk]], viz též [[https://zil.ipipan.waw.pl/seminarium-archiwum?action=AttachFile&do=view&target=2024-10-14.pdf|prezentace]]. |
| |
Alexandr Rosen (2024): Exploring InterCorp v16ud: the potential of a multilingual parallel treebank with complexity and diversity metrics. Instytut Slawistyki Zachodniej i Południowej, Uniwersytet Warszawski. Warszawa, 10/06/2024. [[https://jakobson.korpus.cz/~rosen/INTERCORP/SLIDES/2024_UDCM_Wwa.pdf|Prezentace]] | Alexandr Rosen (2024): Exploring InterCorp v16ud: the potential of a multilingual parallel treebank with complexity and diversity metrics. Instytut Slawistyki Zachodniej i Południowej, Uniwersytet Warszawski. Warszawa, 10/06/2024. [[https://jakobson.korpus.cz/~rosen/INTERCORP/SLIDES/2024_UDCM_Wwa.pdf|Prezentace]] |