AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:intercorp:verze16ud [2024/10/11 10:50] – [Velikost korpusu podle jazyků] alexandrrosencnk:intercorp:verze16ud [2024/10/18 20:33] (aktuální) – [Odkazy – o korpusu InterCorp s anotací podle UD] alexandrrosen
Řádek 377: Řádek 377:
 ^:::|Core-misc|  2|  2|  3,5|  44,4|  52,2|  733,0|  532,9|  12,820|  2,148|  1,051|  4,791|  1,821|  2,385| ^:::|Core-misc|  2|  2|  3,5|  44,4|  52,2|  733,0|  532,9|  12,820|  2,148|  1,051|  4,791|  1,821|  2,385|
 ^:::|Acquis|  1|  18 563|  1 310,5|  15 264,2|  19 702,1|  556,9|  380,4|  13,209|  2,369|  0,886|  6,990|  2,588|  2,647| ^:::|Acquis|  1|  18 563|  1 310,5|  15 264,2|  19 702,1|  556,9|  380,4|  13,209|  2,369|  0,886|  6,990|  2,588|  2,647|
-^[[https://www.loc.gov/standards/iso639-2/php/langcodes_name.php?iso_639_1=fi|fi]]|Bible|  2|  66|  48,0|  542,6|  675,3|  529,0|  351,4|  13,324|  1,911|  0,871|  4,231|  1,534|  2,511|+^:::|Bible|  2|  66|  48,0|  542,6|  675,3|  529,0|  351,4|  13,324|  1,911|  0,871|  4,231|  1,534|  2,511|
 ^:::|Europarl|  1|  67 019|  675,6|  10 109,3|  11 838,6|  670,8|  462,7|  15,260|  2,483|  1,242|  6,924|  2,670|  2,395| ^:::|Europarl|  1|  67 019|  675,6|  10 109,3|  11 838,6|  670,8|  462,7|  15,260|  2,483|  1,242|  6,924|  2,670|  2,395|
 ^:::|Subtitles|  1|  30 900|  23 262,2|  90 481,8|  124 969,7|  666,5|  444,7|  3,909|  1,244|  0,242|  1,404|  0,513|  1,689| ^:::|Subtitles|  1|  30 900|  23 262,2|  90 481,8|  124 969,7|  666,5|  444,7|  3,909|  1,244|  0,242|  1,404|  0,513|  1,689|
Řádek 485: Řádek 485:
 ^:::|PressEurop|  7|  6 991|  160,6|  2 725,2|  3 192,6|  546,7|  429,5|  17,486|  2,219|  1,017|  8,508|  2,772|  2,492| ^:::|PressEurop|  7|  6 991|  160,6|  2 725,2|  3 192,6|  546,7|  429,5|  17,486|  2,219|  1,017|  8,508|  2,772|  2,492|
 ^:::|Subtitles|  1|  45 407|  38 108,1|  211 310,4|  266 731,5|  509,0|  351,2|  5,572|  1,388|  0,383|  2,129|  0,795|  1,954| ^:::|Subtitles|  1|  45 407|  38 108,1|  211 310,4|  266 731,5|  509,0|  351,2|  5,572|  1,388|  0,383|  2,129|  0,795|  1,954|
-^:::|Core-nonfict|  10|  10|  30,6|  518,7|  625,2|  645,0|  495,9|  17,765|  2,613|  1,223|  8,126|  2,801|  2,603|+^[[https://www.loc.gov/standards/iso639-2/php/langcodes_name.php?iso_639_1=ru|ru]]|Core-nonfict|  10|  10|  30,6|  518,7|  625,2|  645,0|  495,9|  17,765|  2,613|  1,223|  8,126|  2,801|  2,603|
 ^:::|Core-fiction|  144|  144|  1 043,5|  11 757,6|  14 913,7|  633,0|  501,9|  11,643|  1,959|  0,865|  4,203|  1,557|  2,386| ^:::|Core-fiction|  144|  144|  1 043,5|  11 757,6|  14 913,7|  633,0|  501,9|  11,643|  1,959|  0,865|  4,203|  1,557|  2,386|
 ^:::|Core-misc|  6|  6|  12,8|  143,8|  180,7|  633,2|  484,5|  11,439|  1,947|  0,870|  4,378|  1,718|  2,265| ^:::|Core-misc|  6|  6|  12,8|  143,8|  180,7|  633,2|  484,5|  11,439|  1,947|  0,870|  4,378|  1,718|  2,265|
Řádek 573: Řádek 573:
  
 Olga Nádvorníková a Alexandr Rosen (2024): Vyhledávání v paralelním korpusu za použití anotace Universal Dependencies. [[https://www.youtube.com/watch?v=5l5Vbb1eQDw&t=190s|Záznam workshopu]] z 17. 9. 2024, doprovodné akce [[https://bcl2024.ff.cuni.cz|Bienále české lingvistiky 2024]], viz též [[https://jakobson.korpus.cz/~rosen/BCL2024/P18_SLIDES/Prezentace_Bienale2024_WorkShop.pdf|prezentace]]. Olga Nádvorníková a Alexandr Rosen (2024): Vyhledávání v paralelním korpusu za použití anotace Universal Dependencies. [[https://www.youtube.com/watch?v=5l5Vbb1eQDw&t=190s|Záznam workshopu]] z 17. 9. 2024, doprovodné akce [[https://bcl2024.ff.cuni.cz|Bienále české lingvistiky 2024]], viz též [[https://jakobson.korpus.cz/~rosen/BCL2024/P18_SLIDES/Prezentace_Bienale2024_WorkShop.pdf|prezentace]].
 +
 +Alexandr Rosen (2024): Lexical and syntactic variability
 +of languages and text genres – a corpus-based study. [[https://www.youtube.com/watch?v=E2ujmqt7Q2E|Záznam přednášky]] ze 14. 10. 2024, [[https://zil.ipipan.waw.pl/seminarium|Seminarium „Przetwarzanie języka naturalnego”]] [[https://zil.ipipan.waw.pl|Zespołu Inżynierii Lingwistycznej]] w [[https://ipipan.waw.pl|Instytucie Podstaw Informatyki]] [[https://pan.pl|Polskiej Akademii Nauk]], viz též [[https://zil.ipipan.waw.pl/seminarium-archiwum?action=AttachFile&do=view&target=2024-10-14.pdf|prezentace]].
  
 Alexandr Rosen (2024): Exploring InterCorp v16ud: the potential of a multilingual parallel treebank with complexity and diversity metrics. Instytut Slawistyki Zachodniej i Południowej, Uniwersytet Warszawski. Warszawa, 10/06/2024. [[https://jakobson.korpus.cz/~rosen/INTERCORP/SLIDES/2024_UDCM_Wwa.pdf|Prezentace]] Alexandr Rosen (2024): Exploring InterCorp v16ud: the potential of a multilingual parallel treebank with complexity and diversity metrics. Instytut Slawistyki Zachodniej i Południowej, Uniwersytet Warszawski. Warszawa, 10/06/2024. [[https://jakobson.korpus.cz/~rosen/INTERCORP/SLIDES/2024_UDCM_Wwa.pdf|Prezentace]]