Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
pojmy:anotace [2013/06/19 21:26] – vaclavcvrcek | pojmy:anotace [2021/01/14 13:12] (aktuální) – [Anotace] tomasjelinek |
---|
====== Anotace ====== | ====== Anotace ====== |
| |
Proces, při němž se obvykle automaticky připojují interpretační lingvistické a/nebo strukturní/segmentační údaje a/nebo metalingvistické údaje k textovým datům korpusu. Lingvistickými údaji jsou například údaje morfologické přiřazované jednotlivým slovním tvarům ([[tag|tagy]]) či údaje syntaktické přiřazované jednotlivým slovním tvarům či jejich skupinám, nebo údaje sémantické, popř. další. | Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní údaje a/nebo metatextové údaje k textovým datům korpusu. Lingvistickými údaji jsou například morfologické značky ([[tag|tagy]]) přiřazované jednotlivým slovním tvarům, značky syntaktické, přiřazované slovním tvarům či jejich skupinám, nebo údaje sémantické, popř. další. |
| |
Při morfologické anotaci se danému slovnímu tvaru typicky přiřadí jeho [[pojmy:lemma|lemma]] a hodnoty morfologických kategorií vč. slovního druhu (procesem [[pojmy:morfologicka_analyza|morfologické analýzy]] a následné [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické [[pojmy:desambiguace|desambiguace]]). | Při morfologické anotaci se danému slovnímu tvaru typicky přiřadí jeho [[pojmy:lemma|lemma]] a hodnoty morfologických kategorií vč. slovního druhu (procesem [[pojmy:morfologicka_analyza|morfologické analýzy]], [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické [[pojmy:desambiguace|disambiguace]]). |
| |
--- //V. Petkevič// | Rozsáhlé korpusy (větší než 1-2 mil. slov) se vždy anotují automaticky. Podrobný postup celého procesu automatické anotace včetně údajů o míře úspěšnosti je popsán na příkladu korpusu [[cnk:SYN2020|SYN2020]] na stránce [[cnk:SYN2020:automaticka_anotace|automatická anotace korpusu SYN2020]]. |
| |
| Vedle anotace, která se vztahuje k jednotlivým [[pojmy:pozice|pozicím]] (slovům) v korpusu (viz [[pojmy:atributy_pozicni|poziční atributy]]), existuje také anotace textů jako celků, které do korpusu vstupují. Tato anotace je pak přístupná k prohledávání ve formě [[pojmy:atributy_strukturni|strukturních atributů]]. |
| |
| --- //V. Petkevič, V. Cvrček, J. Křivan// |
==== Související odkazy ==== | ==== Související odkazy ==== |
| <WRAP round box 50%> |
[[pojmy:atributy_pozicni|Poziční atributy]] | [[pojmy:atributy_pozicni|Poziční atributy]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]] • [[cnk:SYN2020:automaticka_anotace|Automatická anotace SYN2020]] |
| </WRAP> |
[[pojmy:atributy_strukturni|Strukturní atributy]] | |
| |
[[pojmy:struktura_korpusu|Struktura korpusu]] | |