Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:paralelni [2013/07/17 12:20] – vaclavcvrcek | pojmy:paralelni [2015/04/13 09:58] – vaclavcvrcek |
---|
====== Paralelní korpus ====== | ====== Paralelní korpus ====== |
| |
Jeden z [[pojmy:korpus#typy_korpusu|typů korpusů]], jehož účelem je umožnit převést stejnou metodologii, propracovávanou v rámci korpusové lingvistiky původně pouze pro jednojazyčné korpusy, také na výzkum kontrastivní (mezijazykové srovnání). Paralelní korpus je složen z originálů a překladových textů, které mohou být vzájemně zarovnány (tzv. [[pojmy:alignment|alignment]]) na jednotkách různé úrovně (odstavec, věta/skupina vět, popř. slovo). Uživatel tak může prohledávat korpus (libovolnou jazykovou mutaci textu) a sledovat jednotlivá překladová řešení v různých textech (od různých autorů a překladatelů), zjišťovat jejich četnosti a kontext. | Jeden z [[pojmy:korpus#typy_korpusu|typů korpusů]], jehož účelem je rozšířit metodologii, propracovávanou v rámci korpusové lingvistiky původně pouze pro jeden jazyk, také na výzkum kontrastivní (mezijazykové srovnání). Paralelní korpusy se dělí na **srovnatelné** (angl. //comparable//) a **překladové** (angl. //translational//). |
| |
Paralelní korpusy jsou (dnes zatím spíše potenciálně) zdrojem dat pro kvalitnější překladové slovníky, kontrastivní gramatiky a studium specifických rysů překladového jazyka; jsou i vítaným praktickým zdrojem dat pro překladatele a překladová cvičení. | **[[pojmy:srovnatelny|Srovnatelné]] paralelní korpusy** jsou korpusy v různých jazycích, které usilují o to, aby jejich obsah byl srovnatelný, a to jak kvantitou (tedy aby byly stejně velké), tak kvalitou (aby obsahovaly texty stejného typu, žánru, odborného nebo jinak specifického jazyka). |
| |
===== Paralelní korpus InterCorp ===== | **Překladové paralelní korpusy** jsou složeny z originálů a překladů stejných textů, které jsou vzájemně zarovnány (angl. [[pojmy:alignment|aligned]]) na jednotkách různé úrovně (odstavec, věta/skupina vět, popř. slovo nebo fráze). Uživatel tak může prohledávat korpus (libovolnou jazykovou mutaci textu) a sledovat jednotlivá překladová řešení v různých textech (od různých autorů a překladatelů), zjišťovat jejich četnosti a závislost na kontextu. Překladové paralelní korpusy (dvou jazyků) samozřejmě nemusejí obsahovat pouze originály a překlady, ale mohou obsahovat též dvojici překladů stejného textu ze třetího jazyka. Příkladem vícejazyčného překladového paralelního korpusu je projekt ČNK [[cnk:intercorp|InterCorp]]. |
| |
Vedle korpusů jednojazyčných se v rámci projektu ČNK od roku 2005 buduje vícejazyčný korpus paralelní ([[cnk:intercorp|InterCorp]]), zahrnující texty v češtině a jejich překlady do jednoho nebo více z celkem 27 jazyků v celkovém objemu 91 mil. slov (stav roku 2012); počet jazyků není uzavřen. InterCorp je mnohostranný jak co do typů textů tak jazyků, v zásadě je přitom [[pojmy:synchronni|synchronní]] (s texty po r. 1945). Jeho základem je stále složka překladů beletristických, popř. obecně známých textů odborných (ale i textů EU, žurnalistických aj.). Buduje se se snahou o co nejširší užitnost, opřenou o zarovnávání textů (alignment) minimálně na úroveň odstavců, často ale i vět aj. a postupně se obohacuje i o [[pojmy:lemma|lemmatizaci]] a [[pojmy:tag|morfologické značkování]]. | Paralelní korpusy jsou (dnes zatím spíše potenciálně) zdrojem dat pro kvalitnější překladové slovníky, kontrastivní gramatiky a studium specifických rysů jednotlivých jazyků i rozdílů mezi jazykem běžným a jazykem překladovým; jsou též vítaným praktickým zdrojem dat pro překladatele, překladová cvičení a jazykovou výuku. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
[[pojmy:alignment|alignment]] | <WRAP round box 49%> |
| [[pojmy:alignment|Alignment]] • [[cnk:intercorp|InterCorp]] • [[pojmy:korpusy?&#vyber_paralelnich_korpusu|Přehled paralelních korpusů]] |
[[cnk:intercorp|InterCorp]] | </WRAP> |