Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
manualy:treq [2017/04/21 10:17] – [Princip zarovnání] michalskrabal | manualy:treq [2020/08/10 17:08] – španělština adrianzasina |
---|
{{ :manualy:treq.png?direct&200|}} | {{ :manualy:treq.png?direct&200|}} |
| |
Aplikace [[http://treq.korpus.cz|Treq]] slouží k obousměrnému prohledávání česko-cizojazyčných a anglicko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Lze v ní snadno a pohodlně vyhledávat možné překladové ekvivalenty či se inspirovat při hledání synonym. | Aplikace [[http://treq.korpus.cz|Treq]] slouží k obousměrnému prohledávání česko-cizojazyčných, anglicko-cizojazyčných a španělsko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:intercorp|InterCorp]]. Lze v ní snadno a pohodlně vyhledávat možné překladové ekvivalenty či se inspirovat při hledání synonym. |
| |
Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:zaciname|registrace]] všem uživatelům na adrese **[[http://treq.korpus.cz|treq.korpus.cz]]**. | Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:zaciname|registrace]] všem uživatelům na adrese **[[http://treq.korpus.cz|treq.korpus.cz]]**. |
{{:manualy:treq-tabulka.jpg|}} | {{:manualy:treq-tabulka.jpg|}} |
| |
Po dílčích krocích lze sledovat postupný úbytek dat, která jsou ve výsledném slovníku použita. V prvním kroku použijeme pouze zarovnání vět 1:1 – tím přijdeme o 20,7 % vět. Následně se vyberou na základě zarovnání z programu GIZA++ víceslovné ekvivalenty. Vztah mezi velikostí původního korpusu a počtem vyextrahovaných ekvivalentů však nelze jasně předvídat, zvláště pak u víceslovných ekvivalentů, kde vznikají nejrůznější kombinace stejných slov (viz tučně vysázené dvojice níže). Takto by např. vypadal abecedně řazený soupis česko-anglických párů extrahovaných z druhé příkladové věty: | Po dílčích krocích lze sledovat postupný úbytek dat, která jsou ve výsledném slovníku použita. V prvním kroku použijeme pouze zarovnání vět 1:1 – tím přijdeme o 20,7 % vět. Následně se vyberou na základě zarovnání z programu GIZA++ jedno- a víceslovné ekvivalenty. Vztah mezi velikostí původního korpusu a počtem vyextrahovaných ekvivalentů však nelze jasně předvídat, zvláště pak u víceslovných ekvivalentů, kde vznikají nejrůznější kombinace stejných slov (viz tučně vysázené dvojice níže). Takto by např. vypadal abecedně řazený soupis česko-anglických párů extrahovaných z druhé příkladové věty: |
| |
//a – and// | //a – and// |
[{{:manualy:basic.png?direct&300|Jednoduché hledání v německo-české části}}] | [{{:manualy:basic.png?direct&300|Jednoduché hledání v německo-české části}}] |
[{{:manualy:regex.png?direct&300|Pokročilé hledání (pomocí regulárních výrazů) v anglicko-české části}}] | [{{:manualy:regex.png?direct&300|Pokročilé hledání (pomocí regulárních výrazů) v anglicko-české části}}] |
| |
| ===== Jak citovat Treq ===== |
| |
| <WRAP round tip 80%> |
| Vavřín, M. – Rosen, A.: Treq. FF UK. Praha 2015. Dostupný z WWW: <http://treq.korpus.cz>. |
| |
| Škrabal, M. – Vavřín, M. (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), s. 245–260. |
| </WRAP> |
| |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |