AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
manualy:morfio [2015/01/21 15:50] – upraveno mimo DokuWiki 127.0.0.1manualy:morfio [2021/06/21 12:48] (aktuální) – [Princip] michalskrabal
Řádek 1: Řádek 1:
 ====== Morfio ====== ====== Morfio ======
 +
 +{{ :manualy:morfio_logo.png?nolink&200|}}
  
 Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování). Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování).
  
-Morfio je webová aplikace dostupná bez registrace na adrese **[[http://morfio.korpus.cz|morfio.korpus.cz]]**. +Morfio je webová aplikace dostupná bez [[kurz:zaciname|registrace]] na adrese **[[http://morfio.korpus.cz|morfio.korpus.cz]]**. 
  
-{{ kurz:morfio-logo.png?nolink&200|}} 
  
 Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. [[manualy:syd|SyD]]), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný ke sdílení a citování. Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. [[manualy:syd|SyD]]), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný ke sdílení a citování.
Řádek 18: Řádek 19:
 Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi).  Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). 
  
-Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. Ve výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají:+Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. Báze obou slov zůstává nespecifikovaná, nicméně musí platit, že je v obou slovech stejná. Ve výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají:
  
-''dřevo - dřevěný, +''dřevo - dřevěný''\\ 
-olovo - olověný, +''olovo - olověný''\\ 
-síto - sítěný''+''síto - sítěný''
  
 Zároveň zde ale najdeme také příklady, u nichž žádnou slovotvornou motivaci identifikovat nelze: Zároveň zde ale najdeme také příklady, u nichž žádnou slovotvornou motivaci identifikovat nelze:
  
-''milo - milený, +''milo - milený''\\ 
-živo - živený, +''živo - živený''\\ 
-dělo - dělený''+''dělo - dělený''
  
-Na rozdíl od běžně užívaného přístupu [[wp>onomasiology|onomaziologického]] (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup [[wp>semasiology|semaziologický]]). To samozřejmě může přinášet problémy (např. v případě [[wp>homonym|homonymie]]), jejichž řešení přesahuje možnosti takto koncipovaného nástroje+Na rozdíl od běžně užívaného přístupu [[wp>onomasiology|onomaziologického]] (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup [[wp>semasiology|semaziologický]]). To samozřejmě může přinášet problémy (např. v případě [[wp>homonym|homonymie]]), jejichž řešení přesahuje možnosti takto koncipovaného nástroje a vyžaduje ruční analýzu prováděnou jazykovědcem.
- +
-Vyžadovat přesnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo v jazyce jako je čeština nepraktické. V rámci slovotvorných procesu dochází totiž často k pravidelným změnám hlásek v bázi, k tzv. **alternacím**. Aplikace Morfio s alternacemi počítá a jejich rozsah je možné nastavit (např. jde o tyto záměny //e -- é//: //letět -- létat//; //i -- e//: //prosit -- prošen//; r -- ř: //starý -- stařec//; //sk -- šť//: //český -- čeština// apod.).+
  
 Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů. Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů.
 +
 +==== Alternace ====
 +
 +Vyžadovat přesnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo v jazyce, jako je čeština, nepraktické. V rámci slovotvorných procesů dochází totiž často k pravidelným změnám hlásek v bázi, k tzv. **alternacím**. Aplikace Morfio s alternacemi počítá a jejich rozsah je možné nastavit (např. jde o tyto záměny //e -- é//: //letět -- létat//; //i -- e//: //prosit -- prošen//; r -- ř: //starý -- stařec//; //sk -- šť//: //český -- čeština// apod.).
 +
 +===== Cizojazyčné verze =====
 +
 +Aplikace Morfio byla úspěšně adaptována také na další jazyky: na polštinu a lotyštinu. Jazyk lze přepnout v horní části dotazovacího formuláře pod volbou Jazyk (defaultně je nastavena čeština).
  
 ===== Obrázky aplikace ===== ===== Obrázky aplikace =====
Řádek 43: Řádek 50:
 [{{:kurz:morfio-help.png?direct&200|Nápověda aplikace Morfio}}] [{{:kurz:morfio-help.png?direct&200|Nápověda aplikace Morfio}}]
  
-==== Související odkazy ====+===== Jak citovat Morfio =====
  
-<WRAP round box 49%> +<WRAP round tip 80%> 
-[[manualy:kontext:index|Rozhraní KonText]] • [[syd|SyD]] • [[kwords|KWords]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]]+Cvrček, V. – Vondřička, P.Morfio. FF UK. Praha 2013. Dostupný z WWW<http://morfio.korpus.cz>
 + 
 +Cvrček, V. – Vondřička, P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Hradec Králové: Gaudeamus. 
 + 
 +**Cizojazyčné verze:** 
 + 
 +Zasina, A. J. (2017): Konkurence koncovek -a a -u v genitivu singuláru neživotných maskulin v polštině. In: M. Stluka – M. Škrabal (eds.): Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla Kučery. Praha: Nakladatelství Lidové noviny, s. 90–98. 
 + 
 +Škrabal, M. – Vondřička, P. – Cvrček, V. (2020): Morfio – A Corpus-Based Perspective on Latvian Morphology. In: A. Utka et al. (eds.): Human Language Technologies – The Baltic Perspective. Proceedings of the Ninth International Conference Baltic HLT 2020. AmsterdamIOS Press, s. 207–214.
 </WRAP> </WRAP>
  
 +==== Související odkazy ====
 +
 +<WRAP round box 50%>
 +[[manualy:kontext:index|Rozhraní KonText]] • [[syd|SyD]] • [[kwords|KWords]] • [[treq|Treq]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]]
 +</WRAP>