Nastavení

Toto je starší verze dokumentu!


Paralelní korpus

Jeden z typů korpusů, jehož účelem je rozšířit metodologii, propracovávanou v rámci korpusové lingvistiky původně pouze pro jeden jazyk, také na výzkum kontrastivní (mezijazykové srovnání). Paralelní korpusy se dělí na srovnatelné (angl. comparable) a překladové (angl. translational).

Srovnatelné paralelní korpusy jsou korpusy v různých jazycích, které usilují o to, aby jejich obsah byl srovnatelný, a to jak kvantitou (tedy aby byly stejně velké), tak kvalitou (aby obsahovaly texty stejného typu, žánru, odborného nebo jinak specifického jazyka).

Překladové paralelní korpusy jsou složeny z originálů a překladů stejných textů, které jsou vzájemně zarovnány (angl. aligned) na jednotkách různé úrovně (odstavec, věta/skupina vět, popř. slovo nebo fráze). Uživatel tak může prohledávat korpus (libovolnou jazykovou mutaci textu) a sledovat jednotlivá překladová řešení v různých textech (od různých autorů a překladatelů), zjišťovat jejich četnosti a závislost na kontextu. Překladové paralelní korpusy (dvou jazyků) samozřejmě nemusejí obsahovat pouze originály a překlady, ale mohou obsahovat též dvojici překladů stejného textu ze třetího jazyka. Příkladem vícejazyčného překladového paralelního korpusu je projekt ČNK InterCorp.

Paralelní korpusy jsou (dnes zatím spíše potenciálně) zdrojem dat pro kvalitnější překladové slovníky, kontrastivní gramatiky a studium specifických rysů jednotlivých jazyků i rozdílů mezi jazykem běžným a jazykem překladovým; jsou též vítaným praktickým zdrojem dat pro překladatele, překladová cvičení a jazykovou výuku.

Související odkazy