AplikaceAplikace
Nastavení

This is an old revision of the document!


Treq

The Treq application serves for searching Czech - foreign language dictionaries, which have been automatically created based on data derived from the parallel corpus InterCorp. It enables users to search for all possible equivalents used in translations, or to find synonyms.

Treq is an online application (the only thing we need to use it is a web browser) and it is accessible without registration to all users at treq.korpus.cz.

When searching, it is necessary to first select a foreign language (Language 2:) and the language of the input word (Search in:). The word may be typed in a specific form or as lemma (Lemma: Yes/No). We may also choose whether the result should be based on the fiction core, individual collections or all texts in the given version of the InterCorp corpus with the help of (Restrict to:). We input the (Query:) and click on Search.

Výsledkem dotazu je seznam nalezených překladů zadaného slova, implicitně setříděných sestupně podle frekvence. Pro ověření výskytu v textovém okolí je možné si dvojici výrazů vyhledat v rozhraní KonText dotazem do korpusu InterCorp, který vyvoláme kliknutím na vybraný ekvivalent. Počet výskytů se však může lišit – paralelní dotaz najde i konkordance, v nichž potenciální ekvivalent odpovídá jinému slovu.

Princip zarovnání

Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++1). Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční.

Application pictures

Input form
Searching in the Czech-English section
Searching in the Czech-German section