Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
pojmy:morfologicka_analyza [2013/05/28 16:55] – vaclavcvrcek | pojmy:morfologicka_analyza [2021/01/14 14:40] – tomasjelinek |
---|
Například morfologická analýza věty //Sním je místo něho.// přiřadí jednotlivým slovním tvarům tyto údaje (v prvním sloupci je analyzovaný tvar, ve druhém lemma, ve třetím značka): | Například morfologická analýza věty //Sním je místo něho.// přiřadí jednotlivým slovním tvarům tyto údaje (v prvním sloupci je analyzovaný tvar, ve druhém lemma, ve třetím značka): |
| |
|Sním | **sníst** | **''<nowiki>VpS--1d</nowiki>''** | | |Sním | **sníst** | **''<nowiki>VB-S---1....P</nowiki>''** | |
|::: | snít | ''<nowiki>VpS--1n</nowiki>'' | | |::: | snít | ''<nowiki>VB-S---1....I</nowiki>'' | |
|je | být | ''<nowiki>VpS--3n</nowiki>'' | | |je | být | ''<nowiki>VB-S---3....I</nowiki>'' | |
|::: | ono | ''<nowiki>PPSN4--</nowiki>'' | | |::: | on | ''<nowiki>PPNS4---....-</nowiki>'' | |
|::: | oni | ''<nowiki>PPPM4--</nowiki>'' | | |::: | oni | ''<nowiki>PPMP4---....-</nowiki>'' | |
|::: | **ony** | **''<nowiki>PPPI4--</nowiki>''** | | |::: | **oni** | **''<nowiki>PPIP4---....-</nowiki>''** | |
|::: | ony | ''<nowiki>PPPF4--</nowiki>'' | | |::: | oni | ''<nowiki>PPFP4---....-</nowiki>'' | |
|::: | ona | ''<nowiki>PPPN4--</nowiki>'' | | |::: | oni | ''<nowiki>PPNP4---....-</nowiki>'' | |
|místo | místo | ''<nowiki>NNSN1--</nowiki>'' | | |místo | místo | ''<nowiki>NNNS1---.....</nowiki>'' | |
|::: | **místo** | **''<nowiki>R---2--</nowiki>''** | | |::: | **místo** | **''<nowiki>RR--2---....-</nowiki>''** | |
|něho | něha | ''<nowiki>NNSF5--</nowiki>'' | | |něho | něha | ''<nowiki>NNFS5---....-</nowiki>'' | |
|::: | **on** | **''<nowiki>PPSM2--</nowiki>''** | | |::: | **on** | **''<nowiki>P5MS2--3....-</nowiki>''** | |
|::: | on | ''<nowiki>PPSM4--</nowiki>'' | | |::: | on | ''<nowiki>P5MS4--3....-</nowiki>'' | |
|::: | on | ''<nowiki>PPSI2--</nowiki>'' | | |::: | on | ''<nowiki>PPIS2--3....-</nowiki>'' | |
|::: | ono | ''<nowiki>PPSN2--</nowiki>'' | | |::: | on | ''<nowiki>PPNS2--3....-</nowiki>'' | |
|. | . | ''<nowiki>Z------</nowiki>'' | | |. | . | ''<nowiki>Z:------....-</nowiki>'' | |
| |
Symboly ve značce mají tento význam: | Symboly ve značce mají tento význam:\\ |
- pozice: slovní druh: V – sloveso, P – zájmeno, N – substantivum, R – předložka, Z – interpunkce | 1. pozice: slovní druh: V – sloveso, P – zájmeno, N – substantivum, R – předložka, Z – interpunkce\\ |
- pozice: poddruh slovního druhu: p – prézens, P – osobní zájmeno, N – apelativum | 2. pozice: poddruh slovního druhu: B – prézens, P – osobní zájmeno, N – apelativum, 5 - tvar os. zájmena po předložce, : - interpunkce\\ |
- pozice: číslo: S – singulár, P – plurál | 3. pozice: číslo: S – singulár, P – plurál\\ |
- pozice: jmenný rod: M – maskulinum životné, I – maskulinum neživotné. F – femininum, N – neutrum | 4. pozice: jmenný rod: M – maskulinum životné, I – maskulinum neživotné. F – femininum, N – neutrum\\ |
- pozice: pád: 1 – nominativ, 2 – genitiv, 4 – akuzativ, 5 – vokativ | 5. pozice: pád: 1 – nominativ, 2 – genitiv, 4 – akuzativ, 5 – vokativ\\ |
- pozice: osoba: 1 – první, 3 – třetí | 6.-7. pozice: zde nevyužito\\ |
- pozice: vid: d – dokonavý, n – nedokonavý | 8. pozice: osoba: 1 – první, 3 – třetí\\ |
| 9.-12. pozice: pro zjednodušení nahrazeno tečkami\\ |
| 13. pozice (zde jen u sloves, po mezeře): vid: P – dokonavý, I – nedokonavý\\ |
| |
Morfologická analýza se provádí počítačovým programem, zvaným morfologický analyzátor, a je součástí morfologické anotace, jejíž součástí je lemmatizace a morfologická disambiguace, operující obv. na výsledku morfologické analýzy. Výsledkem korektní [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické disambiguace následující po morfologické analýze uvedené věty jsou interpretace označené **tučně**. | Morfologická analýza se provádí počítačovým programem, zvaným //morfologický analyzátor//, a je součástí morfologické anotace, jejíž součástí je lemmatizace a morfologická [[pojmy:desambiguace|desambiguace]], operující obvykle na výsledku morfologické analýzy. Výsledkem správné [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické desambiguace následující po morfologické analýze uvedené věty jsou interpretace označené **tučně**. |
| |
| Podrobný postup celého procesu automatické anotace včetně údajů o míře úspěšnosti je popsán na příkladu korpusu [[cnk:SYN2020|SYN2020]] na stránce [[cnk:SYN2020:automaticka_anotace|automatická anotace korpusu SYN2020]]. |
| |
--- //V. Petkevič, V. Cvrček// | --- //V. Petkevič, V. Cvrček// |
| |
| ==== Související odkazy ==== |
| |
| <WRAP round box 49%> |
| [[pojmy:desambiguace|Desambiguace]] • [[pojmy:lemma|Lemmatizace]] • [[pojmy:tag|Tagování]] • [[pojmy:anotace|Anotace]] • [[cnk:SYN2020:automaticka_anotace|Automatická anotace SYN2020]] |
| </WRAP> |