AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
manual:morfio [2014/11/25 21:08] Václav Cvrčekmanualy:morfio [2021/06/21 12:48] (aktuální) – [Princip] Michal Škrabal
Řádek 1: Řádek 1:
 ====== Morfio ====== ====== Morfio ======
  
-Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace.+{{ :manualy:morfio_logo.png?nolink&200|}}
  
-Morfio je webová aplikace dostupná bez registrace na adrese [[http://morfio.korpus.cz|morfio.korpus.cz]]. Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. [[manual:syd|SyD]]), je i v rámci SyDu k dispozici permanentní odkaz, který vede k položenému zadání.+Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování). 
 + 
 +Morfio je webová aplikace dostupná bez [[kurz:zaciname|registrace]] na adrese **[[http://morfio.korpus.cz|morfio.korpus.cz]]** 
 + 
 + 
 +Součástí aplikace je podrobná nápověda a popis zobrazených výsledků. Stejně jako v jiných aplikacích (např. [[manualy:syd|SyD]]), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, a je tak vhodný ke sdílení a citování.
  
 ===== Princip ===== ===== Princip =====
  
-{{ :manual:morfio-logo.png?nolink&200|}}+Obecně je každý slovotvorný vztah -- vedle složky sémantické, kterou lze jen obtížně automaticky uchopit -- vytvářen dalšími dvěma faktory:
  
-Obecně je každý slovotvorný vztah -- vedle složky sémantické, kterou lze jen obtížně automaticky uchopit -- vytvářen  
   - formální shodou/podobností v určitých částech slova, tzv. **báze** (např. //dřev-// je část společná pro slova //dřevo// i //dřevěný//   - formální shodou/podobností v určitých částech slova, tzv. **báze** (např. //dřev-// je část společná pro slova //dřevo// i //dřevěný//
   - formálními odlišnostmi v částech specifických, tzv. **formantech** (morfy //-o// a //-ěný// v předchozím příkladu).    - formálními odlišnostmi v částech specifických, tzv. **formantech** (morfy //-o// a //-ěný// v předchozím příkladu). 
  
-Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které se shodují v bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). +Cílem aplikace Morfio je najít všechny dvojice, resp. trojice nebo čtveřice, jednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). 
  
 +Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slov, kde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. Báze obou slov zůstává nespecifikovaná, nicméně musí platit, že je v obou slovech stejná. Ve výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají:
  
 +''dřevo - dřevěný''\\
 +''olovo - olověný''\\
 +''síto - sítěný''
  
-Výše uvedený íklad slovotvorného modelu tak odpovídá dvojicím slovkde první z nich je substantivum končící v nom. sg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//. Ve výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální stránce odpovídají:+Zároveň zde ale najdeme také íkladynichž žádnou slovotvornou motivaci identifikovat nelze:
  
-''dřevo dřevěný, +''milo milený''\\ 
-olovo olověný, +''živo živený''\\ 
-síto sítě''+''dělo dělený''
  
-Zároveň zde ale najdeme také íkladyu nichž žádnou slovotvornou motivaci nenajdeme:+Na rozdíl od běžně užívaného ístupu [[wp>onomasiology|onomaziologického]] (význam → forma) se při vytěžování korpusukterý není sémanticky označkován, musí vycházet od formy (přístup [[wp>semasiology|semaziologický]]). To samozřejmě může přinášet problémy (např. v případě [[wp>homonym|homonymie]]), jejichž řešení přesahuje možnosti takto koncipovaného nástroje a vyžaduje ruční analýzu prováděnou jazykovědcem.
  
-''milo - milený, +Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úpravrevize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat takaby analýza byla rychlejší, výtěžnější a celkově pro badatele jednodušší. Stejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů.
-živo - živený, +
-dělo - dělený''+
  
-Na rozdíl od běžně užívaného přístupu onomaziologického (význam → forma) se při vytěžování korpusu, který není sémanticky označkován, musí vycházet od formy (přístup semaziologický). To samozřejmě může přinášet problémy (např. v případě homonymie), jejichž řešení přesahuje možnosti takto koncipovaného nástroje.+==== Alternace ====
  
-Výstupem aplikace Morfio tak není a nemůže být bezchybný a bez jakýchkoli úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely edzpracovat takaby analýza byla rychlejšívýtěžnější celkově pro badatele jednoduššíStejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledků, zatímco jejich relevantnost ([[pojmy:precision|precision]]je zcela ponechána na úsudku uživatele: tj. samotné formulaci dotazu a následném vyhodnocení nálezů.+Vyžadovat esnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo v jazycejako je češtinanepraktické. V rámci slovotvorných procesů dochází totiž často k pravidelným změnám hlásek v bázi, k tzv. **alternacím**. Aplikace Morfio s alternacemi počítá jejich rozsah je možné nastavit (např. jde o tyto záměny //e -- é//: //letět -- létat//; //i -- e//: //prosit -- prošen//; r -- ř: //starý -- stařec//; //sk -- šť//: //český -- čeština// apod.). 
 + 
 +===== Cizojazyčné verze ===== 
 + 
 +Aplikace Morfio byla úspěšně adaptována také na další jazykyna polštinu lotyštinu. Jazyk lze epnout v horní části dotazovacího formuláře pod volbou Jazyk (defaultně je nastavena čeština).
  
 ===== Obrázky aplikace ===== ===== Obrázky aplikace =====
  
-[{{:manual:morfio-vysledky.png?direct&200|Zadání a výstupní obrazovka}}] +[{{:kurz:morfio-vysledky.png?direct&200|Zadání a výstupní obrazovka}}] 
-[{{:manual:morfio-retrograd.png?direct&200|Retrográdní třídění nalezených výsledků}}] +[{{:kurz:morfio-retrograd.png?direct&200|Retrográdní třídění nalezených výsledků}}] 
-[{{:manual:morfio-prod.png?direct&200|Odhad produktivity jednotlivých typů}}] +[{{:kurz:morfio-prod.png?direct&200|Odhad produktivity jednotlivých typů}}] 
-[{{:manual:morfio-help.png?direct&200|Nápověda aplikace Morfio}}]+[{{:kurz:morfio-help.png?direct&200|Nápověda aplikace Morfio}}] 
 + 
 +===== Jak citovat Morfio ===== 
 + 
 +<WRAP round tip 80%> 
 +Cvrček, V. – Vondřička, P.: Morfio. FF UK. Praha 2013. Dostupný z WWW: <http://morfio.korpus.cz>
 + 
 +Cvrček, V. – Vondřička, P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Hradec Králové: Gaudeamus. 
 + 
 +**Cizojazyčné verze:** 
 + 
 +Zasina, A. J. (2017): Konkurence koncovek -a a -u v genitivu singuláru neživotných maskulin v polštině. In: M. Stluka – M. Škrabal (eds.): Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla Kučery. Praha: Nakladatelství Lidové noviny, s. 90–98. 
 + 
 +Škrabal, M. – Vondřička, P. – Cvrček, V. (2020): Morfio – A Corpus-Based Perspective on Latvian Morphology. In: A. Utka et al. (eds.): Human Language Technologies – The Baltic Perspective. Proceedings of the Ninth International Conference Baltic HLT 2020. Amsterdam: IOS Press, s. 207–214. 
 +</WRAP>
  
 ==== Související odkazy ==== ==== Související odkazy ====
  
-<WRAP round box 49%> +<WRAP round box 50%> 
-[[manual:menu:index|Rozhraní KonText]] • [[manual:syd|SyD]] • [[manual:kwords|KWords]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]]+[[manualy:kontext:index|Rozhraní KonText]] • [[syd|SyD]] • [[kwords|KWords]] • [[treq|Treq]] • [[pojmy:korpusovy_manazer|Korpusový manažer]] • [[pojmy:nastroje|Korpusové nástroje]]
 </WRAP> </WRAP>