AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
manualy:treq [2017/04/06 15:32] – [Obrázky aplikace] michalskrabalmanualy:treq [2022/12/30 17:39] (aktuální) capka
Řádek 1: Řádek 1:
 ====== Treq ====== ====== Treq ======
  
-{{ :manualy:treq.png?direct&200|}}+{{ :manualy:treq.png?nolink&200|}}
  
-Aplikace [[http://treq.korpus.cz|Treq]] slouží k obousměrnému prohledávání česko-cizojazyčných anglicko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Lze v ní snadno a pohodlně vyhledávat možné překladové ekvivalenty či se inspirovat při hledání synonym.+Aplikace [[http://treq.korpus.cz|Treq]] slouží k obousměrnému prohledávání česko-cizojazyčnýchanglicko-cizojazyčných a španělsko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Lze v ní snadno a pohodlně vyhledávat možné překladové ekvivalenty či se inspirovat při hledání synonym.
  
-Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:zaciname|registrace]] všem uživatelům na adrese **[[http://treq.korpus.cz|treq.korpus.cz]]**.+Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:zaciname|registrace]] všem uživatelům na adrese **[[http://treq.korpus.cz|treq.korpus.cz]]**. Kromě toho je možné používat Treq i přes [[manualy:api|API]].
  
 Nejdříve zvolíme výchozí jazyk, v němž je hledaný výraz, a cílový jazyk, do něhož jej chceme přeložit. Slovo můžeme zadat v konkrétním tvaru, v základním slovníkovém tvaru (//Lemmata//), lze vyhledávat i víceslovnou jednotku (//Víceslovné//), využít při hledání regulární výrazy (//Regulární//) nebo v dotazu nerozlišovat velikost písmen (//A = a//). Můžeme si také vybrat, zda má být výsledek založen na překladech beletristického jádra, jednotlivých kolekcí, nebo všech textů v InterCorpu (//Omezit na://). Pak slovo zadáme (//Dotaz://) a klikneme na //Hledej//. Výsledkem dotazu je seznam nalezených překladů zadaného slova, defaultně setříděných sestupně podle frekvence. Realizaci dané dvojice výrazů v kontextu si lze ověřit pomocí hypertextového odkazu, jimž jsou jednotlivé ekvivalenty opatřeny. Počet výskytů udávaný v rozhraní Treq a KonText se však může lišit -- paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu. Nejdříve zvolíme výchozí jazyk, v němž je hledaný výraz, a cílový jazyk, do něhož jej chceme přeložit. Slovo můžeme zadat v konkrétním tvaru, v základním slovníkovém tvaru (//Lemmata//), lze vyhledávat i víceslovnou jednotku (//Víceslovné//), využít při hledání regulární výrazy (//Regulární//) nebo v dotazu nerozlišovat velikost písmen (//A = a//). Můžeme si také vybrat, zda má být výsledek založen na překladech beletristického jádra, jednotlivých kolekcí, nebo všech textů v InterCorpu (//Omezit na://). Pak slovo zadáme (//Dotaz://) a klikneme na //Hledej//. Výsledkem dotazu je seznam nalezených překladů zadaného slova, defaultně setříděných sestupně podle frekvence. Realizaci dané dvojice výrazů v kontextu si lze ověřit pomocí hypertextového odkazu, jimž jsou jednotlivé ekvivalenty opatřeny. Počet výskytů udávaný v rozhraní Treq a KonText se však může lišit -- paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu.
Řádek 26: Řádek 26:
 Oproti případu výše tu druhé slovo ve zdrojovém jazyku (1) neodpovídá pouze třetímu (2), ale též druhému a čtvrtému (1, 3) slovu v jazyku cílovém atd. Oproti případu výše tu druhé slovo ve zdrojovém jazyku (1) neodpovídá pouze třetímu (2), ale též druhému a čtvrtému (1, 3) slovu v jazyku cílovém atd.
 Z takovéhoto zarovnání je následně vybráno co největší množství kombinací slov, které toto zarovnání umožňuje (viz též příklad extrahovaných ekvivalentů níže).  Z takovéhoto zarovnání je následně vybráno co největší množství kombinací slov, které toto zarovnání umožňuje (viz též příklad extrahovaných ekvivalentů níže). 
-V obou případech jsou zarovnané dvojice slov setříděny a sečteny, výsledky automatické extrakce však už nejsou nijak revidovány a uživateli jsou poskytnuty formou seznamu nalezených ekvivalentů zadaného výrazu, doplněných o absolutní a relativní frekvenci.+V obou případech jsou zarovnané dvojice slov setříděny a sečteny, výsledky automatické extrakce však už nejsou nijak revidovány a uživateli jsou poskytnuty formou seznamu nalezených ekvivalentů zadaného výrazu, doplněných o absolutní a relativní frekvenci. Tyto údaje jsou uživatelovým primárním vodítkem: čím častěji se ekvivalent hledaného výrazu vyskytl ve srovnání s ostatními ekvivalenty, tím vyšší je pravděpodobnost, že je funkční.  
 V jakém poměru jsou frekvence nalezené v KonTextu s těmi zobrazovanými Treqem, ukazuje přiložená tabulka. Ta vyčísluje různé typy dat v jednotlivých fázích jejich zpracování pro Treq z anglické složky IC v9 (víceslovná varianta). V jakém poměru jsou frekvence nalezené v KonTextu s těmi zobrazovanými Treqem, ukazuje přiložená tabulka. Ta vyčísluje různé typy dat v jednotlivých fázích jejich zpracování pro Treq z anglické složky IC v9 (víceslovná varianta).
  
 {{:manualy:treq-tabulka.jpg|}} {{:manualy:treq-tabulka.jpg|}}
  
-Po dílčích krocích lze sledovat postupný úbytek dat, která jsou ve výsledném slovníku použita. V prvním kroku použijeme pouze zarovnání vět 1:1 – tím přijdeme o 20,7 % vět.  Následně se vyberou na základě zarovnání z programu GIZA++ víceslovné ekvivalenty. Vztah mezi velikostí původního korpusu a počtem vyextrahovaných ekvivalentů však nelze jasně předvídat, zvláště pak u víceslovných ekvivalentů, kde vznikají nejrůznější kombinace stejných slov (viz tučně vysázené dvojice níže). Takto by např. vypadal abecedně řazený soupis česko-anglických párů extrahovaných z druhé příkladové věty:+Po dílčích krocích lze sledovat postupný úbytek dat, která jsou ve výsledném slovníku použita. V prvním kroku použijeme pouze zarovnání vět 1:1 – tím přijdeme o 20,7 % vět.  Následně se vyberou na základě zarovnání z programu GIZA++ jedno- a víceslovné ekvivalenty. Vztah mezi velikostí původního korpusu a počtem vyextrahovaných ekvivalentů však nelze jasně předvídat, zvláště pak u víceslovných ekvivalentů, kde vznikají nejrůznější kombinace stejných slov (viz tučně vysázené dvojice níže). Takto by např. vypadal abecedně řazený soupis česko-anglických párů extrahovaných z druhé příkladové věty:
  
 //a – and// //a – and//
Řádek 68: Řádek 69:
 [{{:manualy:basic.png?direct&300|Jednoduché hledání v německo-české části}}] [{{:manualy:basic.png?direct&300|Jednoduché hledání v německo-české části}}]
 [{{:manualy:regex.png?direct&300|Pokročilé hledání (pomocí regulárních výrazů) v anglicko-české části}}] [{{:manualy:regex.png?direct&300|Pokročilé hledání (pomocí regulárních výrazů) v anglicko-české části}}]
 +
 +===== Jak citovat Treq =====
 +
 +<WRAP round tip 80%>
 +Vavřín, M. – Rosen, A.: Treq. FF UK. Praha 2015. Dostupný z WWW: <http://treq.korpus.cz>.
 +
 +Škrabal, M. – Vavřín, M. (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), s. 245–260.
 +</WRAP>
 +
  
 ==== Související odkazy ==== ==== Související odkazy ====