Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
pojmy:anotace [2013/09/26 22:53]
Pavel Vondřička [Anotace]
pojmy:anotace [2021/01/14 13:12] (aktuální)
Tomáš Jelínek [Anotace]
Řádek 1: Řádek 1:
 ====== Anotace ====== ====== Anotace ======
  
-Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní/segmentační údaje (FIXME to je co?? segmentace není podle mě anotace a už vůbec to nejsou údaje!) a/nebo metalingvistické údaje [FIXME spíš metatextové, ne?] k textovým datům korpusu. Lingvistickými údaji jsou například morfologické značky ([[tag|tagy]]) přiřazované jednotlivým slovním tvarům, značky syntaktické, přiřazované slovním tvarům či jejich skupinám, nebo údaje sémantické, popř. další. +Proces, při němž se ručně či automaticky připojují interpretační lingvistické, strukturní údaje a/nebo metatextové údaje k textovým datům korpusu. Lingvistickými údaji jsou například morfologické značky ([[tag|tagy]]) přiřazované jednotlivým slovním tvarům, značky syntaktické, přiřazované slovním tvarům či jejich skupinám, nebo údaje sémantické, popř. další. 
  
-Při morfologické anotaci se danému slovnímu tvaru typicky přiřadí jeho [[pojmy:lemma|lemma]] a hodnoty morfologických kategorií vč. slovního druhu (procesem [[pojmy:morfologicka_analyza|morfologické analýzy]], [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické [[pojmy:desambiguace|desambiguace]]).+Při morfologické anotaci se danému slovnímu tvaru typicky přiřadí jeho [[pojmy:lemma|lemma]] a hodnoty morfologických kategorií vč. slovního druhu (procesem [[pojmy:morfologicka_analyza|morfologické analýzy]], [[pojmy:lemma#lemmatizace|lemmatizace]] a morfologické [[pojmy:desambiguace|disambiguace]]).
  
-Vedle anotace, která se vztahuje k jednotlivým [[pojmy:pozice|pozicím]] (slovům) v korpusu, existuje také anotace textů jako celků, které do korpusu vstupujíTato anotace je pak ístupná k prohledávání ve formě [[pojmy:atributy_strukturni|strukturních atributů]].+Rozsáhlé korpusy (větší než 1-2 mil. slov) se vždy anotují automatickyPodrobný postup celého procesu automatické anotace včetně údajů o míře úspěšnosti je popsán na íkladu korpusu [[cnk:SYN2020|SYN2020]] na stránce [[cnk:SYN2020:automaticka_anotace|automatická anotace korpusu SYN2020]].
  
- --- //V. Petkevič, V. Cvrček//+Vedle anotace, která se vztahuje k jednotlivým [[pojmy:pozice|pozicím]] (slovům) v korpusu (viz [[pojmy:atributy_pozicni|poziční atributy]]), existuje také anotace textů jako celků, které do korpusu vstupují. Tato anotace je pak přístupná k prohledávání ve formě [[pojmy:atributy_strukturni|strukturních atributů]]. 
 + 
 + --- //V. Petkevič, V. Cvrček, J. Křivan//
 ==== Související odkazy ==== ==== Související odkazy ====
 <WRAP round box 50%> <WRAP round box 50%>
-[[pojmy:atributy_pozicni|Poziční atributy]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]]+[[pojmy:atributy_pozicni|Poziční atributy]] • [[pojmy:atributy_strukturni|Strukturní atributy]] • [[pojmy:struktura_korpusu|Struktura korpusu]] • [[cnk:SYN2020:automaticka_anotace|Automatická anotace SYN2020]]
 </WRAP> </WRAP>