AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
pojmy:morfologicka_analyza [2013/09/13 14:51] – Schvaleno pro 1. verzi vaclavcvrcekpojmy:morfologicka_analyza [2022/08/13 13:33] (aktuální) – [Morfologická analýza] alexandrrosen
Řádek 5: Řádek 5:
 Například morfologická analýza věty //Sním je místo něho.// přiřadí jednotlivým slovním tvarům tyto údaje (v prvním sloupci je analyzovaný tvar, ve druhém lemma, ve třetím značka): Například morfologická analýza věty //Sním je místo něho.// přiřadí jednotlivým slovním tvarům tyto údaje (v prvním sloupci je analyzovaný tvar, ve druhém lemma, ve třetím značka):
  
-|Sním | **sníst** | **''<nowiki>VpS--1d</nowiki>''** | +|Sním | **sníst** | **''<nowiki>VB-S---1----P--</nowiki>''** | 
-|::: | snít | ''<nowiki>VpS--1n</nowiki>''+|::: | snít | ''<nowiki>VB-S---1----I--</nowiki>''
-|je | být | ''<nowiki>VpS--3n</nowiki>''+|je | být | ''<nowiki>VB-S---3----I--</nowiki>''
-|::: | ono | ''<nowiki>PPSN4--</nowiki>''+|::: | on | ''<nowiki>PPNS4----------</nowiki>''
-|::: | oni | ''<nowiki>PPPM4--</nowiki>''+|::: | oni | ''<nowiki>PPMP4----------</nowiki>''
-|::: | **ony** | **''<nowiki>PPPI4--</nowiki>''** | +|::: | **oni** | **''<nowiki>PPIP4----------</nowiki>''** | 
-|::: | ony | ''<nowiki>PPPF4--</nowiki>''+|::: | oni | ''<nowiki>PPFP4----------</nowiki>''
-|::: | ona | ''<nowiki>PPPN4--</nowiki>''+|::: | oni | ''<nowiki>PPNP4----------</nowiki>''
-|místo | místo | ''<nowiki>NNSN1--</nowiki>''+|místo | místo | ''<nowiki>Db-------------</nowiki>''
-|::: | **místo** | **''<nowiki>R---2--</nowiki>''** | +|::: | místo | ''<nowiki>NNNS1----------</nowiki>''
-|něho | něha | ''<nowiki>NNSF5--</nowiki>'' |  +|::: | místo | ''<nowiki>NNNS4----------</nowiki>''
-|::: | **on** | **''<nowiki>PPSM2--</nowiki>''** | +|::: | místo | ''<nowiki>NNNS5----------</nowiki>''
-|::: | on | ''<nowiki>PPSM4--</nowiki>''+|::: | **místo** | **''<nowiki>RR--2----------</nowiki>''** | 
-|::: | on | ''<nowiki>PPSI2--</nowiki>''+|něho | něha | ''<nowiki>NNFS5----------</nowiki>'' |  
-|::: | ono | ''<nowiki>PPSN2--</nowiki>''+|::: | **on** | **''<nowiki>P5MS2--3-------</nowiki>''** | 
-|. | . | ''<nowiki>Z------</nowiki>'' |+|::: | on | ''<nowiki>P5MS4--3-------</nowiki>''
 +|::: | on | ''<nowiki>P5IS2--3-------</nowiki>''
 +|::: | on | ''<nowiki>P5NS2--3-------</nowiki>''
 +|. | . | ''<nowiki>Z:-------------</nowiki>'' |
  
-Symboly ve značce mají tento význam: +Symboly ve značce mají tento význam:\\ 
-  pozice: slovní druh: V – sloveso, P – zájmeno, N – substantivum, R – předložka, Z – interpunkce + 1. pozice: **slovní druh**: V – sloveso, P – zájmeno, N – substantivum, D – příslovce, R – předložka, Z – interpunkce\\ 
-  pozice: poddruh slovního druhu: – prézens, P – osobní zájmeno, N – apelativum + 2. pozice: **poddruh slovního druhu**– prézens, P – osobní zájmeno, N – apelativum, 5 tvar os. zájmena po předložce, - interpunkcepříslovce (nestupňovatelné)\\ 
-  pozicečíslo: S – singulárP – plurál + 3. pozice: **jmenný rod**: M – maskulinum životné, I – maskulinum neživotné. F – femininum, N – neutrum\\ 
-  - pozice: jmenný rod: M – maskulinum životné, I – maskulinum neživotné. F – femininum, N – neutrum + 4. pozice: **číslo**: S – singulár, P – plurál\\ 
-  pozice: pád: 1 – nominativ, 2 – genitiv, 4 – akuzativ, 5 – vokativ + 5. pozice: **pád**: 1 – nominativ, 2 – genitiv, 4 – akuzativ, 5 – vokativ\\ 
-  - pozice: osoba: 1 – první, 3 – třetí + 6.-7. pozice: zde nevyužito\\ 
-  - pozice: vid: – dokonavý, – nedokonavý+ 8. pozice: **osoba**: 1 – první, 3 – třetí\\ 
 + 9.-12. pozice: zde nevyužito (hodnoty nahrazeny "-")\\ 
 + 13. pozice: **vid**– dokonavý, – nedokonavý\\ 
 + 14.-15. pozice: zde nevyužito\\
  
-Morfologická analýza se provádí počítačovým programem, zvaným //morfologický analyzátor//, a je součástí morfologické anotace, jejíž součástí je lemmatizace a morfologická [[pojmy:desambiguace|desambiguace]], operující obvykle na výsledku morfologické analýzy. Výsledkem správné [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické desambiguace následující po morfologické analýze uvedené věty jsou interpretace označené **tučně**.+Morfologická analýza se provádí počítačovým programem, zvaným //morfologický analyzátor//, a je součástí morfologické anotace; na morfologickou analýzu obvykle navazuje lemmatizace a morfologická [[pojmy:desambiguace|desambiguace]]. Výsledkem správné [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické desambiguace následující po morfologické analýze uvedené věty jsou interpretace označené **tučně**. 
  
- --- //V. Petkevič, V. Cvrček//+V korpusech ČNK se pro české texty používá tzv. "pražská" morfologická analýza navržená na ÚFAL MFF UK pro Pražský závislostní korpus, s některými odlišnostmi specifickými pro ČNK. Verze [[cnk:intercorp:verze13ud|13ud]] paralelního korpusu [[cnk:intercorp|InterCorp]] je morfologicky (a syntakticky) anotována alternativním způsobem podle zásad mezinárodního projektu [[pojmy:ud|Universal Dependencies]]. 
 + 
 +Podrobný postup celého procesu automatické anotace včetně údajů o míře úspěšnosti je popsán na příkladu korpusu [[cnk:SYN2020|SYN2020]] na stránce [[cnk:SYN2020:automaticka_anotace|automatická anotace korpusu SYN2020]]. 
 + 
 + --- //V. Petkevič, V. Cvrček, T. Jelínek, J. Křivan//
  
 ==== Související odkazy ==== ==== Související odkazy ====
  
 <WRAP round box 49%> <WRAP round box 49%>
-[[pojmy:desambiguace|Desambiguace]] • [[pojmy:lemma|Lemmatizace]] • [[pojmy:tag|Tagování]] • [[pojmy:anotace|Anotace]]+[[pojmy:desambiguace|Desambiguace]] • [[pojmy:lemma|Lemmatizace]] • [[pojmy:tag|Tagování]] • [[pojmy:anotace|Anotace]] • [[cnk:SYN2020:automaticka_anotace|Automatická anotace SYN2020]]
 </WRAP> </WRAP>