Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
| Obě strany předchozí revizePředchozí verze | |
| cnk:ortofon [2025/04/15 10:42] – [Jak citovat] michalkren | cnk:ortofon [2026/01/22 16:07] (aktuální) – [Morfologické značkování korpusu ORTOFON] krivan |
|---|
| ===== Morfologické značkování korpusu ORTOFON ===== | ===== Morfologické značkování korpusu ORTOFON ===== |
| |
| Korpus ORTOFON v3 je automaticky [[pojmy:anotace|anotován]], a to [[seznamy:tagy|novou morfologickou značkou]] podle standardu SYN2020. Jsou v něm mj. rozpoznány [[pojmy:agregat|agregáty]] (např. //vidělas//, //zač//), využívá se [[cnk:syn2020:lemmatizace|dvojúrovňové lemmatizace]] a k dispozici je i slovesná značka ([[pojmy:verbtag|verbtag]]). | Korpus ORTOFON v3 je automaticky [[pojmy:anotace|anotován]], a to [[seznamy:tagy|novou morfologickou značkou]] podle [[cnk:anotacni_standard_cnk|anotačního standardu ČNK]]. Jsou v něm mj. rozpoznány [[pojmy:agregat|agregáty]] (např. //vidělas//, //zač//), využívá se [[cnk:syn2020:lemmatizace|dvojúrovňové lemmatizace]] a k dispozici je i slovesná značka ([[pojmy:verbtag|verbtag]]). |
| |
| V korpusu jsou označkovány i substandardní varianty a tvary typické pro nářečí a spontánní mluvenou řeč. Zvláštní varianty slov jsou odlišené vlastním sublemmatem (např. //poslúchat// pod lemmatem //poslouchat//), zvláštní tvary značkované jen v mluveném korpusu mají na poslední pozici tagu číslo ''%%9%%'' (např. tvar //jezdijó// má tag ''%%VB-P---3P-AAI-9%%''). | V korpusu jsou označkovány i substandardní varianty a tvary typické pro nářečí a spontánní mluvenou řeč. Zvláštní varianty slov jsou odlišené vlastním sublemmatem (např. //poslúchat// pod lemmatem //poslouchat//), zvláštní tvary značkované jen v mluveném korpusu mají na poslední pozici tagu číslo ''%%9%%'' (např. tvar //jezdijó// má tag ''%%VB-P---3P-AAI-9%%''). |