AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:paralelni [2014/11/24 12:51] vaclavcvrcekpojmy:paralelni [2015/01/30 16:41] – [[[cnk:intercorp|Paralelní korpus InterCorp]]] michalavacikova
Řádek 9: Řádek 9:
 Paralelní korpusy jsou (dnes zatím spíše potenciálně) zdrojem dat pro kvalitnější překladové slovníky, kontrastivní gramatiky a studium specifických rysů jednotlivých jazyků i rozdílů mezi jazykem běžným a jazykem překladovým; jsou též vítaným praktickým zdrojem dat pro překladatele, překladová cvičení a jazykovou výuku. Paralelní korpusy jsou (dnes zatím spíše potenciálně) zdrojem dat pro kvalitnější překladové slovníky, kontrastivní gramatiky a studium specifických rysů jednotlivých jazyků i rozdílů mezi jazykem běžným a jazykem překladovým; jsou též vítaným praktickým zdrojem dat pro překladatele, překladová cvičení a jazykovou výuku.
  
-===== Paralelní korpus InterCorp =====+ [[cnk:intercorp|Paralelní korpus InterCorp]]  
  
-Vedle korpusů jednojazyčných se v rámci projektu ČNK od roku 2005 buduje vícejazyčný překladový paralelní korpus ([[cnk:intercorp|InterCorp]]), zahrnující texty v češtině a více než 27 jazycích v celkovém objemu 91 mil. slov (stav k roku 2012); počet jazyků ani velikost jednotlivých jazykových korpusů nejsou uzavřeny, nejde tedy o korpus(y) [[pojmy:referencni|referenční]]. InterCorp je mnohostranný jak co do typů textů, tak jazyků; v zásadě je přitom [[pojmy:synchronni|synchronní]] (s texty po r. 1945). Jeho kvalitativním základem je manuálně zarovnávaná složka překladů beletristických, popř. obecně známých textů odborných, doplněná automaticky zarovnanými texty z mnohojazyčné legislativy EU, žurnalistických překladových projektů Syndicate, EuroPress apod. Buduje se se snahou o co nejširší užitnost, opřenou o zarovnávání textů alespoň na úrovni vět, a postupně se obohacuje o [[pojmy:lemma|lemmatizaci]] a [[pojmy:tag|morfologické značkování]] ve všech jazycích, kde jsou patřičné nástroje k dispozici. 
  
 ==== Související odkazy ==== ==== Související odkazy ====