AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:romcro [2026/05/19 11:56] jankocekcnk:romcro [2026/05/22 17:09] (aktuální) – [Jak citovat RomCro] michalkren
Řádek 2: Řádek 2:
  
 Projekt Paralelní korpus románských jazyků a chorvatštiny (RomCro) byl zahájen v roce 2019 na katedře románské lingvistiky Katedry romanistiky Fakulty humanitních a sociálních věd Záhřebské univerzity. Korpus sdružuje pět románských jazyků (francouzštinu, portugalštinu, rumunštinu, italštinu, španělštinu a nedávno katalánštinu)  a díky zařazení chorvatštiny přispívá k rozšíření stávajících jazykových zdrojů pro chorvatštinu. Skládá se z literárních textů z 20. a 21. století, přičemž každý text v původním jazyce je doplněn překlady do dalších jazyků. Projekt Paralelní korpus románských jazyků a chorvatštiny (RomCro) byl zahájen v roce 2019 na katedře románské lingvistiky Katedry romanistiky Fakulty humanitních a sociálních věd Záhřebské univerzity. Korpus sdružuje pět románských jazyků (francouzštinu, portugalštinu, rumunštinu, italštinu, španělštinu a nedávno katalánštinu)  a díky zařazení chorvatštiny přispívá k rozšíření stávajících jazykových zdrojů pro chorvatštinu. Skládá se z literárních textů z 20. a 21. století, přičemž každý text v původním jazyce je doplněn překlady do dalších jazyků.
-Korpus RomCro vznikl za podpory Fakulty humanitních a společenských věd Univerzity v Záhřebu v letech 2019 až 2025. Nová verze byla rovněž vyvinuta v rámci projektu podporovaného Chorvatskou vědeckou nadací a financovaného Evropskou unií – NextGenerationEU (číslo projektu: MOBODL 2023 08 9511). Nová verze korpusu obsahuje tři nové tituly v portugalštině a chorvatštině. Dále byl přidán šestý románský jazyk, katalánština, a to integrací stávajících katalánských překladů a zařazením tří katalánských románů s překlady do jiných jazyků. Ve srovnání s první verzí korpusu (viz tabulka 1) obsahuje RomCro v.2.0 54 nových textů, o 24 200 překladových jednotek více a o 3,7 milionu slov více, což činí celkem 19,4 milionu slov. 
  
-Translated with DeepL.com (free version)+Korpus RomCro vznikl za podpory Fakulty humanitních a společenských věd Univerzity v Záhřebu v letech 2019 až 2025Nová verze byla rovněž vyvinuta v rámci projektu podporovaného Chorvatskou vědeckou nadací a financovaného Evropskou unií – NextGenerationEU (číslo projektu: MOBODL 2023 08 9511). Nová verze korpusu obsahuje tři nové tituly v portugalštině a chorvatštině. Dále byl přidán šestý románský jazyk, katalánština, a to integrací stávajících katalánských překladů a zařazením tří katalánských románů s překlady do jiných jazyků. Ve srovnání s první verzí korpusu (není dostupná v ČNK; viz také tabulka 1) obsahuje RomCro v.2.0 54 nových textů, o 24 200 překladových jednotek více a o 3,7 milionu slov více, což činí celkem 19,4 milionu slov.
  
  
 ^                               ^**RomCro v.1.0**^**RomCro v.2.0**^**Rozdíl**^ ^                               ^**RomCro v.1.0**^**RomCro v.2.0**^**Rozdíl**^
-|**jazyky**                  |  6  |  7               |  **1**         | +|**jazyky**                  |  6  |  **7**               |  1         | 
-|**překladové jednotky**          |  142,470          166,742         |  **24,272**    | +|**překladové jednotky**          |  142,470         |  **166,742**         |  24,272    | 
-|**originály**                  |  27              |  33              |  **6**         | +|**originály**                  |  27              |  **33**               6         | 
-|**počet textů**                |  159              213             |  **54**        | +|**počet textů**                |  159             |  **213**             |  54        | 
-|**velikost (v milionech slov)**|  15.7            |  19.4            |  **3.7**       |+|**velikost (v milionech slov)**|  15.7            |  **19.4**             3.7       |
  
-RomCro byl anotován pomocí [[https://ufal.mff.cuni.cz/udpipe|UDPipe]] podle standardu [[https://universaldependencies.org/|Universal Dependencies]]  (UD), což znamená, že je nejen lematizován a morfologicky tagován, ale jeho anotace zahrnuje i syntaxi. RomCro je zpřístupněn prostřednictvím uživatelského rozhraní [[http://kontext.korpus.cz/|KonText]] způsobem, který navazuje na UD verze paralelního korpusu [[https://wiki.korpus.cz/doku.php/en:cnk:intercorp|InterCorp]].+RomCro byl anotován nástrojem [[https://ufal.mff.cuni.cz/udpipe|UDPipe]] podle standardu [[https://universaldependencies.org/|Universal Dependencies]] (UD), což znamená, že je nejen lematizován a morfologicky označkován, ale jeho anotace zahrnuje také syntax. RomCro je zpřístupněn prostřednictvím uživatelského rozhraní [[http://kontext.korpus.cz/|KonText]] podobně jako UD verze paralelního korpusu [[https://wiki.korpus.cz/doku.php/en:cnk:intercorp|InterCorp]].
  
 ===== Jak citovat RomCro ===== ===== Jak citovat RomCro =====
  
-Bikić-Carić, G.Mikelenić, B. Bezlaj, M. (2023). Construcción del RomCro, un corpus paralelo multilingüe. //Procesamiento del Lenguaje Natural//, 70. Sociedad Española para el Procesamiento del Lenguaje Natural, 99-110.+Bikić-Carić, G. – Mikelenić, B. – Bezlaj, M. (2023). Construcción del RomCro, un corpus paralelo multilingüe. //Procesamiento del Lenguaje Natural//, 70. Sociedad Española para el Procesamiento del Lenguaje Natural, 99110.
  
-Mikelenić, B.Bikić-Carić, G.Bezlaj, M.Oliver, A. Tadić, M. (2025). //RomCro v.2.0 - Parallel corpus of Romance languages ​​and Croatian//HR-CLARIN, http://hdl.handle.net/20.500.14615/2-16+Mikelenić, B. – Bikić-Carić, G. – Bezlaj, M. – Oliver, A. – Tadić, M. (2025). //RomCro v.2.0 - Parallel corpus of Romance languages ​​and Croatian//HR-CLARIN, http://hdl.handle.net/20.500.14615/2-16
  
 * Článek z roku 2023 popisuje vytvoření korpusu RomCro v.1.0, zatímco záznam v repozitáři z roku 2025 odkazuje na RomCro v.2.0 v repozitáři HR-CLARIN. Při odkazování na tento korpus prosím uveďte oba zdroje. * Článek z roku 2023 popisuje vytvoření korpusu RomCro v.1.0, zatímco záznam v repozitáři z roku 2025 odkazuje na RomCro v.2.0 v repozitáři HR-CLARIN. Při odkazování na tento korpus prosím uveďte oba zdroje.