AplikaceAplikace
Nastavení

Paralelní korpus

Jeden z typů korpusů, jehož účelem je rozšířit metodologii, propracovávanou v rámci korpusové lingvistiky původně pouze pro jeden jazyk, také na výzkum kontrastivní (mezijazykové srovnání) a translatologický (porovnání jazyka překladu s nepřekladovými texty). Ačkoli dříve se pojmem paralelní korpusy souhrnně označovaly všechny typy vícejazyčných korpusů (vč. korpusů srovnatelných), v současné době je termín paralelní korpus vyhrazen pro takový vícejazyčný korpus, který obsahuje originální texty v jednom jazyce a jejich překlady do jiného jazyka/jazyků. Podle počtu jazyků můžeme rozlišovat paralelní korpus dvoujazyčný (angl. bilingual) nebo vícejazyčný (angl. multilingual). V závislosti na směru překladu pak může jít o korpus jednosměrný (angl. unidirectional) zahrnující např. jen anglické originály a jejich české překlady nebo obousměrný (angl. bidirectional) zahrnující např. i české originály a jejich anglické překlady. Pokud je podíl textů v obou směrech vyvážený, mluví se někdy také o tzv. korpusu recipročním (angl. reciprocal).

Základní vlastností paralelního korpusu, skládajícího se z části překladové (angl. translational) a originální, bývá zarovnání (angl. alignment) v rámci stejného segmentu textu u obou jazyků (odstavce, souvětí, popř. slova či fráze), přičemž nejčastěji bývají paralelní korpusy zarovnány po větách či souvětích. Uživatel tak může prohledávat korpus (libovolnou jazykovou mutaci textu) a sledovat jednotlivá překladová řešení v různých textech (od různých autorů a překladatelů), zjišťovat jejich četnosti a závislost na kontextu. Ačkoli originální text by vždy měl být součástí paralelního korpusu, v rámci vícejazyčných paralelních korpusů lze samozřejmě zkoumat též dva či více překladů stejného textu v různých jazycích.

Příkladem vícejazyčného paralelního korpusu je projekt ČNK InterCorp.

Paralelní korpusy jsou cenným zdrojem dat pro překladové slovníky, kontrastivní gramatiky a studium specifických rysů jednotlivých jazyků i rozdílů mezi jazykem běžným a jazykem překladovým; jsou též vítaným praktickým zdrojem dat pro překladatele, překladová cvičení a jazykovou výuku.

Související odkazy