Toto je starší verze dokumentu!
Treq
Aplikace Treq slouží k prohledávání česko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu InterCorp. Slouží tak k rychlému vyhledání možných překladových ekvivalentů či pro inspiraci při hledání synonym.
Při hledání je třeba nejprve zvolit cizí jazyk (Jazyk 2:) a jazyk zadávaného slova (Hledat v:). Slovo můžeme zadat v konkrétním tvaru nebo jako lemma (Lemmata: Ano/Ne). Můžeme si také vybrat, zda má být výsledek založen na excerpci z beletristického jádra, z jednotlivých kolekcí, nebo ze všech textů v InterCorpu (Omezit na:). Pak slovo zadáme (Dotaz:) a klikneme na Hledej.
Výsledkem dotazu je seznam nalezených překladů zadaného slova, implicitně setříděných sestupně podle frekvence. Pro ověření výskytu v textovém okolí je možné si dvojici výrazů vyhledat v rozhraní KonText dotazem do korpusu InterCorp kliknutím na ekvivalent. Počet výskytů se však může lišit – paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu.
Treq vychází z textů 8. verze paralelního korpusu InterCorp. Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++1). Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční.