AplikaceAplikace
Nastavení

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
en:manualy:morfio [2016/12/08 13:30] – created veronikapojarovaen:manualy:morfio [2021/03/09 15:12] (current) jankocek
Line 1: Line 1:
 ====== Morfio ====== ====== Morfio ======
  
-{{ kurz:morfio-logo.png?nolink&200|}}+{{ :manualy:morfio_logo.png?nolink&200|}}
  
-Aplikace //[[https://morfio.korpus.cz|Morfio]]// slouží k odhadování rozsahu produktivity slovotvorných modelů v češtině na základě korpusových dat. Jedná se tak o pomůcku, která je využitelná zejména pro slovotvorný výzkumzejména v oblasti derivace (odvozování).+The //[[https://morfio.korpus.cz|Morfio]]// application serves to give estimates of the extent and productivity of morphological models in Czech based on corpus data. It is therefore tool which can be used in morphological researchespecially for the study of derivation.
  
-Morfio je webová aplikace dostupná bez [[kurz:zaciname|registrace]] na adrese **[[http://morfio.korpus.cz|morfio.korpus.cz]]**. +Morfio is an online application and is accessible without  [[en:kurz:zaciname|registration]] to all users at  **[[http://morfio.korpus.cz|morfio.korpus.cz]]**. 
  
  
-Součástí aplikace je podrobná nápověda popis zobrazených výsledkůStejně jako v jiných aplikacích (např. [[manualy:syd|SyD]]), je i v rámci Morfia k dispozici permanentní odkaz, který vede k položenému zadání, je tak vhodný ke sdílení a citování. +The application includes detailed manual and description of displayed resultsJust like in other applications (e.g. [[en:manualy:syd|SyD]]),  Morfio provides permanent link leading to the input query, which is therefore appropriate for sharing and citing.
-===== Princip =====+
  
-Obecně je každý slovotvorný vztah -- vedle složky sémantické, kterou lze jen obtížně automaticky uchopit -- vytvářen dalšími dvěma faktory:+===== Principle =====
  
-  formální shodou/podobností v určitých částech slova, tzv. **báze** (např. //dřev-// je část společná pro slova //dřevo// i //dřevěný//)  +Generally every morphological relation -- excluding the semantic componentwhich cannot be easily grasped computationally -- is created by two other factors:
-  formálními odlišnostmi v částech specifickýchtzv. **formantech** (morfy //-o// a //-ěný// v předchozím příkladu). +
  
-Cílem aplikace Morfio je najít všechny dvojiceresptrojice nebo čtveřicejednotek v korpusu, které mají shodnou bázi a liší se pouze specifikovanými formanty (a příp. i vymezenými hláskovými alternacemi). +  - a formal congruence/similarity in particular parts of the wordso-called **bases** (e.g. //dřev-// is held in common by the words //dřevo// and //dřevěný//)  
 +  - formal differences in specific partsso-called **formants** (morphs //-o// and //-ěný// from the previous example). 
  
-Výše uvedený příklad slovotvorného modelu tak odpovídá dvojicím slovkde první z nich je substantivum končící v nomsg. na //-o// a druhé slovo je adjektivum končící v nom. sg. masc. na //-ený// nebo //-ěný//Báze obou slov zůstává nespecifikovanánicméně musí platit, že je v obou slovech stejnáVe výsledcích nacházíme dvojice [[pojmy:lemma|lemmat]] (příp. [[pojmy:word|slovních tvarů]], záleží na vstupním nastavení), které zadané podmínce po formální i významové stránce odpovídají:+The aim of the Morfio application is to find all pairs (also groups of three or four)units in the corpus, which have an identical base and differ only in specified formants (and also possible selected sound/phoneme alterations) 
 + 
 +The above example of a morphological model equals pairs of words where the first is a noun ending in //-o// in the nom. sg., and the second word ending in //-ený// nebo //-ěný// in the nom. sg. mascThe base of both words remains unspecifiedhowever it must remain the same in both wordsIn the results we find pairs of [[en:pojmy:lemma|lemmas]] (or [[en:pojmy:word|word forms]], depending on the initial settings), which fulfil the given condition both semantically and formally:
  
 ''dřevo - dřevěný,\\ ''dřevo - dřevěný,\\
Line 24: Line 25:
 síto - sítěný'' síto - sítěný''
  
-Zároveň zde ale najdeme také příkladyu nichž žádnou slovotvornou motivaci identifikovat nelze:+Howeverwe can also find cases where no morphological motivation can be identified:
  
 ''milo - milený,\\ ''milo - milený,\\
Line 30: Line 31:
 dělo - dělený'' dělo - dělený''
  
-Na rozdíl od běžně užívaného přístupu [[wp>onomasiology|onomaziologického]] (význam → formase při vytěžování korpusukterý není sémanticky označkován, musí vycházet od formy (přístup [[wp>semasiology|semaziologický]]). To samozřejmě může přinášet problémy (napřv případě [[wp>homonym|homonymie]]), jejichž ření přesahuje možnosti takto koncipovaného nástroje a vyžaduje ruční analýzu prováděnou jazykovědcem.+Unlike the regular [[wp>onomasiology|onomasiological]] approach (meaning → form), when working with a corpus that is not semantically tagged we must  begin with the form ([[wp>semasiology|semasiological]] approach). This can pose several problems (e.g. in the case of [[wp>homonym|homonymy]]) whose solutions are outside the scope of this tool and require manual analysis carried out by linguists. 
 + 
 +The output of the Morfio application is not and cannot be free of errors and without any further adjustmentsrevisions and linguistic manipulations cannot generate directly publishable results. It is rather a tool which can rework a large amount of data for linguistic purposes, making analysis faster and more accessible for researchers. As with other corpus search engines, the aim is only to reach a success rate of 100% when searching for a given type ([[en:pojmy:recall|recall]]) and to provide an organized sorting of the results, while their relevance and [[en:pojmy:precision|precision]] is left solely to the user's judgement: i.e. the actual query formulation and the subsequent interpretation of the findings. 
 + 
 +==== Alternations ==== 
 + 
 +To require a precise congruence of form between the individual members of the morphological model would be impractical for a language such as Czech, due to the fact that within the morphological processes there are frequently cases of regular phoneme **alternations** in the base.  The Morfio application reckons with alternations and their range can be set (e.g. the alternation of //e -- é// in //letět -- létat//; //i -- e// in //prosit -- prošen//; //r -- ř// in //starý -- stařec//; //sk -- šť// in //český -- čeština// etc.). 
 + 
 +===== Non-Czech versions ===== 
 + 
 +Morfio has also been successfully adapted to other languages: Polish and Latvian. The language can be switched at the top of the query form under the Language option (the default is Czech).  
 + 
 +===== Application images ===== 
 + 
 +[{{:kurz:morfio-vysledky.png?direct&200|Query and output screen}}] 
 +[{{:kurz:morfio-retrograd.png?direct&200|Retrograde sorting of the results}}] 
 +[{{:kurz:morfio-prod.png?direct&200|An estimate of the productivity of the individual types}}] 
 +[{{:kurz:morfio-help.png?direct&200|Morfio application help}}] 
 + 
 + 
 +===== How to cite Morfio =====
  
-Výstupem aplikace Morfio není a nemůže být bezchybný a bez jakýchkoli dalších úprav, revize a lingvistické manipulace publikovatelný výstup, spíš se jedná o pomůcku, která množství dat dokáže pro lingvistické účely předzpracovat tak, aby analýza byla rychlejšívýtěžnější a celkově pro badatele jednoduššíStejně jako u jiných korpusových vyhledávačů je tedy cílem pouze snadné dosažení 100% úspěšnosti hledání daného typu ([[pojmy:recall|recall]]) a přehledné setřídění výsledkůzatímco jejich relevantnost ([[pojmy:precision|precision]]) je zcela ponechána na úsudku uživateletjsamotné formulaci dotazu a následném vyhodnocení nálezů.+<WRAP round tip 80%> 
 +CvrčekV– VondřičkaP.Morfio. FF UK. Praha 2013. Dostupný z WWW<http://morfio.korpus.cz>.
  
-==== Alternace ====+Cvrček, V. – Vondřička, P. (2013): Nástroj pro slovotvornou analýzu jazykového korpusu. //Gramatika a korpus 2012//. Hradec Králové: Gaudeamus.
  
 +**Non-Czech versions:**
  
-Vyžadovat přesnou formální shodu mezi jednotlivými členy slovotvorného modelu by bylo jazyce, jako je čeština, nepraktickéV rámci slovotvorných procesů dochází totiž často k pravidelným změnám hlásek v bázi, k tzv**alternacím**Aplikace Morfio s alternacemi počítá a jejich rozsah je možné nastavit (napřjde o tyto záměny //e -- é////letět -- létat//; //i -- e//: //prosit -- prošen//; r -- ř: //starý -- stařec//; //sk -- šť//: //český -- čeština// apod.).+Zasina, A. J. (2017): Konkurence koncovek -a a -u v genitivu singuláru neživotných maskulin polštiněIn: MStluka – MŠkrabal (eds.)Liſka a czban – Sborník příspěvků k 70. narozeninám prof. Karla KučeryPraha: Nakladatelství Lidové noviny, s. 90–98.
  
-===== Obrázky aplikace =====+Škrabal, M. – Vondřička, P. – Cvrček, V. (2020): Morfio – A Corpus-Based Perspective on Latvian Morphology. In: A. Utka et al. (eds.): Human Language Technologies – The Baltic Perspective. Proceedings of the Ninth International Conference Baltic HLT 2020. Amsterdam: IOS Press, s. 207–214. 
 +</WRAP>
  
-[{{:kurz:morfio-vysledky.png?direct&200|Zadání a výstupní obrazovka}}] 
-[{{:kurz:morfio-retrograd.png?direct&200|Retrográdní třídění nalezených výsledků}}] 
-[{{:kurz:morfio-prod.png?direct&200|Odhad produktivity jednotlivých typů}}] 
-[{{:kurz:morfio-help.png?direct&200|Nápověda aplikace Morfio}}] 
  
 ==== Related links ==== ==== Related links ====