AplikaceAplikace
Nastavení

Morfio

Aplikace Morfio slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování).

Morfio je webová aplikace dostupná bez registrace na adrese morfio.korpus.cz.

Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. SyD), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný ke sdílení a citování.

Princip

Obecně je každý slovotvorný vztah – vedle složky sémantické, kterou lze jen obtížně automaticky uchopit – vytvářen dalšími dvěma faktory:

  1. formální shodou/podobností v určitých částech slova, tzv. báze (např. dřev- je část společná pro slova dřevo i dřevěný)
  2. formálními odlišnostmi v částech specifických, tzv. formantech (morfy -o a -ěný v předchozím příkladu).

Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi).

Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na -o a druhé slovo je adjektivum končící v nom. sg. masc. na -ený nebo -ěný. Báze obou slov zůstává nespecifikovaná, nicméně musí platit, že je v obou slovech stejná. Ve výsledcích nacházíme dvojice lemmat (příp. slovních tvarů, záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají:

dřevo - dřevěný
olovo - olověný
síto - sítěný

Zároveň zde ale najdeme také příklady, u nichž žádnou slovotvornou motivaci identifikovat nelze:

milo - milený
živo - živený
dělo - dělený

Na rozdíl od běžně užívaného přístupu onomaziologického (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup semaziologický). To samozřejmě může přinášet problémy (např. v případě homonymie), jejichž řešení přesahuje možnosti takto koncipovaného nástroje a vyžaduje ruční analýzu prováděnou jazykovědcem.

Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu (recall) a přehledné setřídění výsledků, zatímco jejich relevantnost (precision) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů.

Alternace

Vyžadovat přesnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo v jazyce, jako je čeština, nepraktické. V rámci slovotvorných procesů dochází totiž často k pravidelným změnám hlásek v bázi, k tzv. alternacím. Aplikace Morfio s alternacemi počítá a jejich rozsah je možné nastavit (např. jde o tyto záměny e – é: letět – létat; i – e: prosit – prošen; r – ř: starý – stařec; sk – šť: český – čeština apod.).

Cizojazyčné verze

Aplikace Morfio byla úspěšně adaptována také na další jazyky: na polštinu a lotyštinu. Jazyk lze přepnout v horní části dotazovacího formuláře pod volbou Jazyk (defaultně je nastavena čeština).

Obrázky aplikace

Zadání a výstupní obrazovka
Retrográdní třídění nalezených výsledků
Odhad produktivity jednotlivých typů
Nápověda aplikace Morfio

Jak citovat Morfio

Cvrček, V. – Vondřička, P.: Morfio. FF UK. Praha 2013. Dostupný z WWW: <http://morfio.korpus.cz>.

Cvrček, V. – Vondřička, P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. Gramatika a korpus 2012. Hradec Králové: Gaudeamus.

Cizojazyčné verze:

Zasina, A. J. (2017): Konkurence koncovek -a a -u v genitivu singuláru neživotných maskulin v polštině. In: M. Stluka – M. Škrabal (eds.): Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla Kučery. Praha: Nakladatelství Lidové noviny, s. 90–98.

Škrabal, M. – Vondřička, P. – Cvrček, V. (2020): Morfio – A Corpus-Based Perspective on Latvian Morphology. In: A. Utka et al. (eds.): Human Language Technologies – The Baltic Perspective. Proceedings of the Ninth International Conference Baltic HLT 2020. Amsterdam: IOS Press, s. 207–214.

Související odkazy