AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:paralelni [2013/07/17 12:20] vaclavcvrcekpojmy:paralelni [2019/08/21 12:35] (aktuální) luciechlumska
Řádek 1: Řádek 1:
 ====== Paralelní korpus ====== ====== Paralelní korpus ======
  
-Jeden z [[pojmy:korpus#typy_korpusu|typů korpusů]], jehož účelem je umožnit převést stejnou metodologii, propracovávanou v rámci korpusové lingvistiky původně pouze pro jednojazyčné korpusy, také na výzkum kontrastivní (mezijazykové srovnání). Paralelní korpus je složen z originálů a překladových textů, které mohou být vzájemně zarovnány (tzv. [[pojmy:alignment|alignment]]) na jednotkách různé úrovně (odstavec, věta/skupina větpopř. slovo). Uživatel tak může prohledávat korpus (libovolnou jazykovou mutaci textu) a sledovat jednotlivá ekladová řešení v různých textech (od různých autorů a překladatelů)zjišťovat jejich četnosti a kontext+Jeden z [[pojmy:korpus#typy_korpusu|typů korpusů]], jehož účelem je rozšířit metodologii, propracovávanou v rámci korpusové lingvistiky původně pouze pro jeden jazyk, také na výzkum kontrastivní (mezijazykové srovnání) a translatologický (porovnání jazyka ekladu s nepřekladovými texty). Ačkoli dříve se pojmem paralelní korpusy souhrnně označovaly všechny typy vícejazyčných korpusů (korpusů [[pojmy:srovnatelny|srovnatelných]]), v současné době je termín paralelní korpus vyhrazen pro takový vícejazyčný korpuskterý **obsahuje originální texty v jednom jazyce a jejich překlady do jiného jazyka/jazyků**Podle počtu jazyků můžeme rozlišovat paralelní korpus **dvoujazyčný** (angl. //bilingual//nebo **vícejazyčný** (angl//multilingual//). V závislosti na směru překladu pak může jít o korpus **jednosměrný** (angl. //unidirectional//zahrnující např. jen anglické originály jejich české eklady nebo **obousměrný** (angl. //bidirectional//) zahrnující např. i české originály jejich anglické eklady. Pokud je podíl textů v obou směrech vyváženýmluví se někdy také o tzv. korpusu **recipročním** (angl. //reciprocal//).
  
-Paralelní korpusy jsou (dnes zatím spíše potenciálně) zdrojem dat pro kvalitnější překladové slovníky, kontrastivní gramatiky studium specifických rysů překladového jazyka; jsou vítaným praktickým zdrojem dat pro ekladatele a překladová cvičení.+Základní vlastností paralelního korpusu, skládajícího se z části překladové (angl. //translational//originální, bývá **zarovnání** (angl. [[pojmy:alignment|alignment]]) v rámci stejného segmentu textu u obou jazyků (odstavce, souvětí, popř. slova čfráze), ičemž nejčastěji bývají paralelní korpusy zarovnány po větách či souvětích. Uživatel tak může prohledávat korpus (libovolnou jazykovou mutaci textu) sledovat jednotlivá překladová řešení v různých textech (od různých autorů a překladatelů), zjišťovat jejich četnosti a závislost na kontextu. Ačkoli originální text by vždy měl být součástí paralelního korpusu, v rámci vícejazyčných paralelních korpusů lze samozřejmě zkoumat též dva či více překladů stejného textu v různých jazycích
  
-===== Paralelní korpus InterCorp =====+Příkladem vícejazyčného paralelního korpusu je projekt ČNK [[cnk:intercorp|InterCorp]].
  
-Vedle korpusů jednojazyčných se v rámci projektu ČNK od roku 2005 buduje vícejazyčný korpus paralelní ([[cnk:intercorp|InterCorp]])zahrnující texty v češtině jejich překlady do jednoho nebo více z celkem 27 jazyků v celkovém objemu 91 mil. slov (stav roku 2012); počet jazyků není uzavřen. InterCorp je mnohostranný jak co do typů textů tak jazyků, v zásadě je itom [[pojmy:synchronni|synchronní]] (s texty po r. 1945). Jeho základem je stále složka ekladů beletristickýchpopř. obecně známých textů odborných (ale i textů EU, žurnalistických aj.). Buduje se se snahou o co nejširší užitnost, opřenou o zarovnávání textů (alignment) minimálně na úroveň odstavců, často ale i vět aj. postupně se obohacuje i o [[pojmy:lemma|lemmatizaci]] a [[pojmy:tag|morfologické značkování]].+Paralelní korpusy jsou cenným zdrojem dat pro překladové slovníkykontrastivní gramatiky studium specifických rysů jednotlivých jazyků i rozdílů mezi jazykem běžným a jazykem ekladovým; jsou též vítaným praktickým zdrojem dat pro ekladatelepřekladová cvičení jazykovou výuku.
  
 ==== Související odkazy ==== ==== Související odkazy ====
  
-[[pojmy:alignment|alignment]] +<WRAP round box 49%> 
- +[[pojmy:alignment|Alignment]] • [[cnk:intercorp|InterCorp]] • [[pojmy:korpusy?&#vyber_paralelnich_korpusu|Přehled paralelních korpusů]] 
-[[cnk:intercorp|InterCorp]]+</WRAP>