AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
Následující verzeObě strany příští revize
manualy:treq [2015/10/05 17:38] – vytvořeno vaclavcvrcekmanualy:treq [2017/04/06 14:42] – [Treq] michalskrabal
Řádek 1: Řádek 1:
 ====== Treq ====== ====== Treq ======
  
-Aplikace [[http://treq.korpus.cz|Treq]] slouží k prohledávání česko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Slouží tak k rychlému vyhledání možných překladových ekvivalentů či pro inspiraci při hledání synonym.+{{ :manualy:treq.png?direct&200|}}
  
-Při hledání je třeba nejprve zvolit cizí jazyk (//Jazyk 2://) a jazyk zadávaného slova (//Hledat v://)Slovo můžeme zadat v konkrétním [[pojmy:word|tvaru]] nebo jako [[pojmy:lemma|lemma]] (//Lemmata: Ano/Ne//). Můžeme si také vybrat, zda má být výsledek založen na excerpci z beletristického [[cnk:intercorp:verze8#obsah_korpusu|jádra]], z jednotlivých kolekcí, nebo ze všech textů v InterCorpu (//Omezit na://). Pak slovo zadáme (//Dotaz://klikneme na //Hledej//+Aplikace [[http://treq.korpus.cz|Treq]] slouží k obousměrnému prohledávání česko-cizojazyčných a anglicko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Lze ní snadno pohodlně vyhledávat možné překladové ekvivalenty či se inspirovat při hledání synonym.
  
-Výsledkem dotazu je seznam nalezených překladů zadaného slova, implicitně setříděných sestupně podle frekvence. Pro ověření výskytu v textovém okolí je možné si dvojici výrazů vyhledat v rozhraní [[manualy:kontext:index|KonText]] dotazem do korpusu InterCorp kliknutím na ekvivalent. Počet výskytů se ak může lišit – paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu.+Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:zaciname|registrace]] všem uživatelům na adrese **[[http://treq.korpus.cz|treq.korpus.cz]]**.
  
-Treq vychází z textů [[cnk:intercorp:verze8|8verze paralelního korpusu InterCorp]]. Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++((viz [[http://dx.doi.org/10.1162/089120103321337421|Och–Ney 2003]])). Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční.+Nejdříve zvolíme výchozí jazyk, v němž je hledaný výraz, a cílový jazyk, do něhož jej chceme přeložit. Slovo můžeme zadat v konkrétním tvaru, v základním slovníkovém tvaru (//Lemmata//), lze vyhledávat i víceslovnou jednotku (//Víceslovné//), využít při hledání regulární výrazy (//Regulární//) nebo v dotazu nerozlišovat velikost písmen (//A = a//). Můžeme si také vybrat, zda má být výsledek založen na překladech beletristického jádra, jednotlivých kolekcí, nebo všech textů v InterCorpu (//Omezit na://). Pak slovo zadáme (//Dotaz://) a klikneme na //Hledej//Výsledkem dotazu je seznam nalezených překladů zadaného slova, defaultně setříděných sestupně podle frekvence. Realizaci dané dvojice výrazů v kontextu si lze ověřit pomocí hypertextového odkazu, jimž jsou jednotlivé ekvivalenty opatřeny. Počet výskytů udávaný v rozhraní Treq a KonText se však může lišit -- paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu. 
 + 
 +===== Princip zarovnání ===== 
 + 
 +Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++((viz [[http://dx.doi.org/10.1162/089120103321337421|Och–Ney 2003]])). Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční. 
 + 
 +===== Obrázky aplikace ===== 
 + 
 +[{{:manualy:treq-form.png?direct&300|Zadávací formulář}}] 
 +[{{:manualy:treq-skorapka.png?direct&300|Hledání v česko-anglické části}}] 
 +[{{:manualy:treq-warum.png?direct&300|Hledání v česko-německé části}}] 
 + 
 +==== Související odkazy ==== 
 + 
 +<WRAP round box 50%> 
 +[[manualy:kontext:index|Rozhraní KonText]] • [[syd|SyD]] • [[morfio|Morfio]] • [[kwords|KWords]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]] 
 +</WRAP>