Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize |
manual:morfio [2014/11/25 15:44] – vaclavcvrcek | manualy:morfio [2021/06/21 12:46] – [Princip] michalskrabal |
---|
====== Morfio ====== | ====== Morfio ====== |
| |
Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace. | {{ :manualy:morfio_logo.png?nolink&200|}} |
| |
| Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování). |
| |
| Morfio je webová aplikace dostupná bez [[kurz:zaciname|registrace]] na adrese **[[http://morfio.korpus.cz|morfio.korpus.cz]]**. |
| |
| |
| Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. [[manualy:syd|SyD]]), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný ke sdílení a citování. |
| |
===== Princip ===== | ===== Princip ===== |
| |
Obecně je každý slovotvorný vztah -- vedle složky sémantické, kterou lze jen obtížně automaticky uchopit -- vytvářen | Obecně je každý slovotvorný vztah -- vedle složky sémantické, kterou lze jen obtížně automaticky uchopit -- vytvářen dalšími dvěma faktory: |
- formální shodou/podobností v určitých částech slova, tzv. **báze** (např. //dřev-// je část společná pro slova //dřevo// i //dřevěný//) | - formální shodou/podobností v určitých částech slova, tzv. **báze** (např. //dřev-// je část společná pro slova //dřevo// i //dřevěný//) |
- formálními odlišnostmi v částech specifických, tzv. **formantech** (morfy //-o// a //-ěný// v předchozím příkladu). | - formálními odlišnostmi v částech specifických, tzv. **formantech** (morfy //-o// a //-ěný// v předchozím příkladu). |
| |
Cílem aplikace je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které se shodují v bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). | Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). |
| |
| Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. Báze obou slov zůstává nespecifikovaná, nicméně musí platit, že je v obou slovech stejná. Ve výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají: |
| |
| ''dřevo - dřevěný\\, |
| olovo - olověný\\, |
| síto - sítěný'' |
| |
Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. | Zároveň zde ale najdeme také příklady, u nichž žádnou slovotvornou motivaci identifikovat nelze: |
| |
Na rozdíl od běžně užívaného přístupu onomaziologického (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup semaziologický). To samozřejmě může přinášet problémy (např. v případě homonymie), jejichž řešení přesahuje možnosti takto koncipovaného nástroje. | ''milo - milený\\, |
| živo - živený\\, |
| dělo - dělený'' |
| |
{{ :manual:morfio-logo.png?nolink&200|}} | Na rozdíl od běžně užívaného přístupu [[wp>onomasiology|onomaziologického]] (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup [[wp>semasiology|semaziologický]]). To samozřejmě může přinášet problémy (např. v případě [[wp>homonym|homonymie]]), jejichž řešení přesahuje možnosti takto koncipovaného nástroje a vyžaduje ruční analýzu prováděnou jazykovědcem. |
| |
Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů. | Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů. |
| |
===== Zadávání dotazů ===== | ==== Alternace ==== |
| |
===== Výsledky ===== | Vyžadovat přesnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo v jazyce, jako je čeština, nepraktické. V rámci slovotvorných procesů dochází totiž často k pravidelným změnám hlásek v bázi, k tzv. **alternacím**. Aplikace Morfio s alternacemi počítá a jejich rozsah je možné nastavit (např. jde o tyto záměny //e -- é//: //letět -- létat//; //i -- e//: //prosit -- prošen//; r -- ř: //starý -- stařec//; //sk -- šť//: //český -- čeština// apod.). |
| |
==== Souhrn ==== | ===== Cizojazyčné verze ===== |
| |
| Aplikace Morfio byla úspěšně adaptována také na další jazyky: na polštinu a lotyštinu. Jazyk lze přepnout v horní části dotazovacího formuláře pod volbou Jazyk (defaultně je nastavena čeština). |
| |
==== Výpis ==== | ===== Obrázky aplikace ===== |
| |
| [{{:kurz:morfio-vysledky.png?direct&200|Zadání a výstupní obrazovka}}] |
| [{{:kurz:morfio-retrograd.png?direct&200|Retrográdní třídění nalezených výsledků}}] |
| [{{:kurz:morfio-prod.png?direct&200|Odhad produktivity jednotlivých typů}}] |
| [{{:kurz:morfio-help.png?direct&200|Nápověda aplikace Morfio}}] |
| |
==== Produktivita ==== | ===== Jak citovat Morfio ===== |
| |
| <WRAP round tip 80%> |
| Cvrček, V. – Vondřička, P.: Morfio. FF UK. Praha 2013. Dostupný z WWW: <http://morfio.korpus.cz>. |
| |
==== Vzor ==== | Cvrček, V. – Vondřička, P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Hradec Králové: Gaudeamus. |
| |
| **Cizojazyčné verze:** |
| |
===== Příklady použití ===== | Zasina, A. J. (2017): Konkurence koncovek -a a -u v genitivu singuláru neživotných maskulin v polštině. In: M. Stluka – M. Škrabal (eds.): Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla Kučery. Praha: Nakladatelství Lidové noviny, s. 90–98. |
| |
| Škrabal, M. – Vondřička, P. – Cvrček, V. (2020): Morfio – A Corpus-Based Perspective on Latvian Morphology. In: A. Utka et al. (eds.): Human Language Technologies – The Baltic Perspective. Proceedings of the Ninth International Conference Baltic HLT 2020. Amsterdam: IOS Press, s. 207–214. |
| </WRAP> |
| |
| ==== Související odkazy ==== |
| |
| <WRAP round box 50%> |
| [[manualy:kontext:index|Rozhraní KonText]] • [[syd|SyD]] • [[kwords|KWords]] • [[treq|Treq]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]] |
| </WRAP> |