AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:romcro [2026/05/22 17:09] – [Jak citovat RomCro] michalkrencnk:romcro [2026/05/25 17:25] (aktuální) – [RomCro 2.0 - Paralelní korpus románských jazyků a chorvatštiny] michalkren
Řádek 1: Řádek 1:
 ====== RomCro 2.0 - Paralelní korpus románských jazyků a chorvatštiny ======  ====== RomCro 2.0 - Paralelní korpus románských jazyků a chorvatštiny ====== 
  
-Projekt Paralelní korpus románských jazyků a chorvatštiny (RomCro) byl zahájen v roce 2019 na katedře románské lingvistiky Katedry romanistiky Fakulty humanitních a sociálních věd Záhřebské univerzity. Korpus sdružuje pět románských jazyků (francouzštinu, portugalštinu, rumunštinu, italštinu, španělštinu a nedávno katalánštinu)  a díky zařazení chorvatštiny přispívá k rozšíření stávajících jazykových zdrojů pro chorvatštinu. Skládá se z literárních textů z 20. a 21. století, přičemž každý text v původním jazyce je doplněn překlady do dalších jazyků.+Projekt Paralelní korpus románských jazyků a chorvatštiny (RomCro) byl zahájen v roce 2019 na katedře románské lingvistiky Katedry romanistiky Fakulty humanitních a sociálních věd Záhřebské univerzity. Korpus sdružuje pět románských jazyků (francouzštinu, portugalštinu, rumunštinu, italštinu, španělštinu a nedávno katalánštinu)  a díky zařazení chorvatštiny přispívá k rozšíření stávajících jazykových zdrojů pro chorvatštinu. Skládá se z literárních textů z 20. a 21. století, přičemž každý text v původním jazyce je doplněn překlady do dalších jazyků. Kvůli copyrightu jsou **věty v korpusu náhodně promíchány**.
  
 Korpus RomCro vznikl za podpory Fakulty humanitních a společenských věd Univerzity v Záhřebu v letech 2019 až 2025. Nová verze byla rovněž vyvinuta v rámci projektu podporovaného Chorvatskou vědeckou nadací a financovaného Evropskou unií – NextGenerationEU (číslo projektu: MOBODL 2023 08 9511). Nová verze korpusu obsahuje tři nové tituly v portugalštině a chorvatštině. Dále byl přidán šestý románský jazyk, katalánština, a to integrací stávajících katalánských překladů a zařazením tří katalánských románů s překlady do jiných jazyků. Ve srovnání s první verzí korpusu (není dostupná v ČNK; viz také tabulka 1) obsahuje RomCro v.2.0 54 nových textů, o 24 200 překladových jednotek více a o 3,7 milionu slov více, což činí celkem 19,4 milionu slov. Korpus RomCro vznikl za podpory Fakulty humanitních a společenských věd Univerzity v Záhřebu v letech 2019 až 2025. Nová verze byla rovněž vyvinuta v rámci projektu podporovaného Chorvatskou vědeckou nadací a financovaného Evropskou unií – NextGenerationEU (číslo projektu: MOBODL 2023 08 9511). Nová verze korpusu obsahuje tři nové tituly v portugalštině a chorvatštině. Dále byl přidán šestý románský jazyk, katalánština, a to integrací stávajících katalánských překladů a zařazením tří katalánských románů s překlady do jiných jazyků. Ve srovnání s první verzí korpusu (není dostupná v ČNK; viz také tabulka 1) obsahuje RomCro v.2.0 54 nových textů, o 24 200 překladových jednotek více a o 3,7 milionu slov více, což činí celkem 19,4 milionu slov.
Řádek 16: Řádek 16:
  
 ===== Jak citovat RomCro ===== ===== Jak citovat RomCro =====
 +
 +<WRAP round tip 70%>
  
 Bikić-Carić, G. – Mikelenić, B. – Bezlaj, M. (2023). Construcción del RomCro, un corpus paralelo multilingüe. //Procesamiento del Lenguaje Natural//, 70. Sociedad Española para el Procesamiento del Lenguaje Natural, 99–110. Bikić-Carić, G. – Mikelenić, B. – Bezlaj, M. (2023). Construcción del RomCro, un corpus paralelo multilingüe. //Procesamiento del Lenguaje Natural//, 70. Sociedad Española para el Procesamiento del Lenguaje Natural, 99–110.
Řádek 24: Řádek 26:
  
  
 +</WRAP>