Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
manualy:morfio [2015/01/21 15:29] – Page moved from manual:morfio to manualy:morfio cvrcek | manualy:morfio [2021/06/21 12:48] (aktuální) – [Princip] michalskrabal |
---|
====== Morfio ====== | ====== Morfio ====== |
| |
| {{ :manualy:morfio_logo.png?nolink&200|}} |
| |
Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování). | Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování). |
| |
Morfio je webová aplikace dostupná bez registrace na adrese **[[http://morfio.korpus.cz|morfio.korpus.cz]]**. | Morfio je webová aplikace dostupná bez [[kurz:zaciname|registrace]] na adrese **[[http://morfio.korpus.cz|morfio.korpus.cz]]**. |
| |
{{ :manual:morfio-logo.png?nolink&200|}} | |
| |
Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. [[manual:syd|SyD]]), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný ke sdílení a citování. | Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. [[manualy:syd|SyD]]), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný ke sdílení a citování. |
| |
===== Princip ===== | ===== Princip ===== |
Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). | Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). |
| |
Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. Ve výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají: | Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. Báze obou slov zůstává nespecifikovaná, nicméně musí platit, že je v obou slovech stejná. Ve výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají: |
| |
''dřevo - dřevěný, | ''dřevo - dřevěný''\\ |
olovo - olověný, | ''olovo - olověný''\\ |
síto - sítěný'' | ''síto - sítěný'' |
| |
Zároveň zde ale najdeme také příklady, u nichž žádnou slovotvornou motivaci identifikovat nelze: | Zároveň zde ale najdeme také příklady, u nichž žádnou slovotvornou motivaci identifikovat nelze: |
| |
''milo - milený, | ''milo - milený''\\ |
živo - živený, | ''živo - živený''\\ |
dělo - dělený'' | ''dělo - dělený'' |
| |
Na rozdíl od běžně užívaného přístupu [[wp>onomasiology|onomaziologického]] (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup [[wp>semasiology|semaziologický]]). To samozřejmě může přinášet problémy (např. v případě [[wp>homonym|homonymie]]), jejichž řešení přesahuje možnosti takto koncipovaného nástroje. | Na rozdíl od běžně užívaného přístupu [[wp>onomasiology|onomaziologického]] (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup [[wp>semasiology|semaziologický]]). To samozřejmě může přinášet problémy (např. v případě [[wp>homonym|homonymie]]), jejichž řešení přesahuje možnosti takto koncipovaného nástroje a vyžaduje ruční analýzu prováděnou jazykovědcem. |
| |
Vyžadovat přesnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo v jazyce jako je čeština nepraktické. V rámci slovotvorných procesu dochází totiž často k pravidelným změnám hlásek v bázi, k tzv. **alternacím**. Aplikace Morfio s alternacemi počítá a jejich rozsah je možné nastavit (např. jde o tyto záměny //e -- é//: //letět -- létat//; //i -- e//: //prosit -- prošen//; r -- ř: //starý -- stařec//; //sk -- šť//: //český -- čeština// apod.). | |
| |
Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů. | Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů. |
| |
| ==== Alternace ==== |
| |
| Vyžadovat přesnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo v jazyce, jako je čeština, nepraktické. V rámci slovotvorných procesů dochází totiž často k pravidelným změnám hlásek v bázi, k tzv. **alternacím**. Aplikace Morfio s alternacemi počítá a jejich rozsah je možné nastavit (např. jde o tyto záměny //e -- é//: //letět -- létat//; //i -- e//: //prosit -- prošen//; r -- ř: //starý -- stařec//; //sk -- šť//: //český -- čeština// apod.). |
| |
| ===== Cizojazyčné verze ===== |
| |
| Aplikace Morfio byla úspěšně adaptována také na další jazyky: na polštinu a lotyštinu. Jazyk lze přepnout v horní části dotazovacího formuláře pod volbou Jazyk (defaultně je nastavena čeština). |
| |
===== Obrázky aplikace ===== | ===== Obrázky aplikace ===== |
| |
[{{:manual:morfio-vysledky.png?direct&200|Zadání a výstupní obrazovka}}] | [{{:kurz:morfio-vysledky.png?direct&200|Zadání a výstupní obrazovka}}] |
[{{:manual:morfio-retrograd.png?direct&200|Retrográdní třídění nalezených výsledků}}] | [{{:kurz:morfio-retrograd.png?direct&200|Retrográdní třídění nalezených výsledků}}] |
[{{:manual:morfio-prod.png?direct&200|Odhad produktivity jednotlivých typů}}] | [{{:kurz:morfio-prod.png?direct&200|Odhad produktivity jednotlivých typů}}] |
[{{:manual:morfio-help.png?direct&200|Nápověda aplikace Morfio}}] | [{{:kurz:morfio-help.png?direct&200|Nápověda aplikace Morfio}}] |
| |
| ===== Jak citovat Morfio ===== |
| |
| <WRAP round tip 80%> |
| Cvrček, V. – Vondřička, P.: Morfio. FF UK. Praha 2013. Dostupný z WWW: <http://morfio.korpus.cz>. |
| |
| Cvrček, V. – Vondřička, P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Hradec Králové: Gaudeamus. |
| |
| **Cizojazyčné verze:** |
| |
| Zasina, A. J. (2017): Konkurence koncovek -a a -u v genitivu singuláru neživotných maskulin v polštině. In: M. Stluka – M. Škrabal (eds.): Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla Kučery. Praha: Nakladatelství Lidové noviny, s. 90–98. |
| |
| Škrabal, M. – Vondřička, P. – Cvrček, V. (2020): Morfio – A Corpus-Based Perspective on Latvian Morphology. In: A. Utka et al. (eds.): Human Language Technologies – The Baltic Perspective. Proceedings of the Ninth International Conference Baltic HLT 2020. Amsterdam: IOS Press, s. 207–214. |
| </WRAP> |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |
| |
<WRAP round box 49%> | <WRAP round box 50%> |
[[manualy:kontext:index|Rozhraní KonText]] • [[manual:syd|SyD]] • [[manual:kwords|KWords]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]] | [[manualy:kontext:index|Rozhraní KonText]] • [[syd|SyD]] • [[kwords|KWords]] • [[treq|Treq]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]] |
</WRAP> | </WRAP> |