AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Následující verze
Předchozí verze
Následující verzeObě strany příští revize
manualy:treq [2015/10/05 17:38] – vytvořeno vaclavcvrcekmanualy:treq [2016/09/12 16:22] – [Treq] martinvavrin
Řádek 1: Řádek 1:
 ====== Treq ====== ====== Treq ======
 +
 +{{ :manualy:treq.png?direct&200|}}
  
 Aplikace [[http://treq.korpus.cz|Treq]] slouží k prohledávání česko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Slouží tak k rychlému vyhledání možných překladových ekvivalentů či pro inspiraci při hledání synonym. Aplikace [[http://treq.korpus.cz|Treq]] slouží k prohledávání česko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Slouží tak k rychlému vyhledání možných překladových ekvivalentů či pro inspiraci při hledání synonym.
  
-Při hledání je třeba nejprve zvolit cizí jazyk (//Jazyk 2://) a jazyk zadávaného slova (//Hledat v://). Slovo můžeme zadat v konkrétním [[pojmy:word|tvaru]] nebo jako [[pojmy:lemma|lemma]] (//Lemmata: Ano/Ne//). Můžeme si také vybrat, zda má být výsledek založen na excerpci z beletristického [[cnk:intercorp:verze8#obsah_korpusu|jádra]], z jednotlivých kolekcí, nebo ze všech textů v InterCorpu (//Omezit na://). Pak slovo zadáme (//Dotaz://) a klikneme na //Hledej//+Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:zaciname|registrace]] všem uživatelům na adrese **[[http://treq.korpus.cz|treq.korpus.cz]]**. 
 + 
 +Při hledání je třeba nejprve zvolit cizí jazyk (//Jazyk 2://) a jazyk zadávaného slova (//Hledat v://). Slovo můžeme zadat v konkrétním [[pojmy:word|tvaru]] nebo jako [[pojmy:lemma|lemma]] (//Lemmata: Ano/Ne//). Můžeme si také vybrat, zda má být výsledek založen na excerpci z beletristického [[cnk:intercorp:verze8#obsah_korpusu|jádra]], z jednotlivých kolekcí, nebo ze všech textů v dané verzi korpusu [[cnk:intercorp|InterCorp]] (//Omezit na://). Pak slovo zadáme (//Dotaz://) a klikneme na //Hledej// 
 + 
 +Výsledkem dotazu je seznam nalezených překladů zadaného slova, implicitně setříděných sestupně podle frekvence. Pro ověření výskytu v textovém okolí je možné si dvojici výrazů vyhledat v rozhraní [[manualy:kontext:index|KonText]] dotazem do korpusu InterCorp, který vyvoláme kliknutím na vybraný ekvivalent. Počet výskytů se však může lišit – paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu. 
 +===== Princip zarovnání ===== 
 + 
 +Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++((viz [[http://dx.doi.org/10.1162/089120103321337421|Och–Ney 2003]])). Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční. 
 + 
 +===== Obrázky aplikace ===== 
 + 
 +[{{:manualy:treq-form.png?direct&300|Zadávací formulář}}] 
 +[{{:manualy:treq-skorapka.png?direct&300|Hledání v česko-anglické části}}] 
 +[{{:manualy:treq-warum.png?direct&300|Hledání v česko-německé části}}]
  
-Výsledkem dotazu je seznam nalezených překladů zadaného slova, implicitně setříděných sestupně podle frekvence. Pro ověření výskytu v textovém okolí je možné si dvojici výrazů vyhledat v rozhraní [[manualy:kontext:index|KonText]] dotazem do korpusu InterCorp kliknutím na ekvivalent. Počet výskytů se však může lišit – paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu.+==== Související odkazy ====
  
-Treq vychází z textů [[cnk:intercorp:verze8|8. verze paralelního korpusu InterCorp]]. Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++((viz [[http://dx.doi.org/10.1162/089120103321337421|Och–Ney 2003]])). Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční.+<WRAP round box 50%> 
 +[[manualy:kontext:index|Rozhraní KonText]] • [[syd|SyD]] • [[morfio|Morfio]] • [[kwords|KWords]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]] 
 +</WRAP>