Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
manualy:treq [2017/04/21 10:17]
Michal Škrabal [Princip zarovnání]
manualy:treq [2020/08/10 17:08] (aktuální)
Adrian Zasina španělština
Řádek 3: Řádek 3:
 {{ :​manualy:​treq.png?​direct&​200|}} {{ :​manualy:​treq.png?​direct&​200|}}
  
-Aplikace [[http://​treq.korpus.cz|Treq]] slouží k obousměrnému prohledávání česko-cizojazyčných ​anglicko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:​intercorp|InterCorp]]. Lze v ní snadno a pohodlně vyhledávat možné překladové ekvivalenty či se inspirovat při hledání synonym.+Aplikace [[http://​treq.korpus.cz|Treq]] slouží k obousměrnému prohledávání česko-cizojazyčnýchanglicko-cizojazyčných a španělsko-cizojazyčných slovníků vytvořených automaticky na základě dat paralelního korpusu [[cnk:​intercorp|InterCorp]]. Lze v ní snadno a pohodlně vyhledávat možné překladové ekvivalenty či se inspirovat při hledání synonym.
  
 Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:​zaciname|registrace]] všem uživatelům na adrese **[[http://​treq.korpus.cz|treq.korpus.cz]]**. Treq je webová aplikace (k jejímu užívání stačí internetový prohlížeč) a je dostupná bez [[kurz:​zaciname|registrace]] všem uživatelům na adrese **[[http://​treq.korpus.cz|treq.korpus.cz]]**.
Řádek 32: Řádek 32:
 {{:​manualy:​treq-tabulka.jpg|}} {{:​manualy:​treq-tabulka.jpg|}}
  
-Po dílčích krocích lze sledovat postupný úbytek dat, která jsou ve výsledném slovníku použita. V prvním kroku použijeme pouze zarovnání vět 1:1 – tím přijdeme o 20,7 % vět.  Následně se vyberou na základě zarovnání z programu GIZA++ víceslovné ekvivalenty. Vztah mezi velikostí původního korpusu a počtem vyextrahovaných ekvivalentů však nelze jasně předvídat,​ zvláště pak u víceslovných ekvivalentů,​ kde vznikají nejrůznější kombinace stejných slov (viz tučně vysázené dvojice níže). Takto by např. vypadal abecedně řazený soupis česko-anglických párů extrahovaných z druhé příkladové věty:+Po dílčích krocích lze sledovat postupný úbytek dat, která jsou ve výsledném slovníku použita. V prvním kroku použijeme pouze zarovnání vět 1:1 – tím přijdeme o 20,7 % vět.  Následně se vyberou na základě zarovnání z programu GIZA++ ​jedno- a víceslovné ekvivalenty. Vztah mezi velikostí původního korpusu a počtem vyextrahovaných ekvivalentů však nelze jasně předvídat,​ zvláště pak u víceslovných ekvivalentů,​ kde vznikají nejrůznější kombinace stejných slov (viz tučně vysázené dvojice níže). Takto by např. vypadal abecedně řazený soupis česko-anglických párů extrahovaných z druhé příkladové věty:
  
 //a – and// //a – and//
Řádek 69: Řádek 69:
 [{{:​manualy:​basic.png?​direct&​300|Jednoduché hledání v německo-české části}}] [{{:​manualy:​basic.png?​direct&​300|Jednoduché hledání v německo-české části}}]
 [{{:​manualy:​regex.png?​direct&​300|Pokročilé hledání (pomocí regulárních výrazů) v anglicko-české části}}] [{{:​manualy:​regex.png?​direct&​300|Pokročilé hledání (pomocí regulárních výrazů) v anglicko-české části}}]
 +
 +===== Jak citovat Treq =====
 +
 +<WRAP round tip 80%>
 +Vavřín, M. – Rosen, A.: Treq. FF UK. Praha 2015. Dostupný z WWW: <​http://​treq.korpus.cz>​.
 +
 +Škrabal, M. – Vavřín, M. (2017): Databáze překladových ekvivalentů Treq. //Časopis pro moderní filologii// 99 (2), s. 245–260.
 +</​WRAP>​
 +
  
 ==== Související odkazy ==== ==== Související odkazy ====