AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
pojmy:parser [2013/09/13 15:05] – Schvaleno pro 1. verzi vaclavcvrcekpojmy:parser [2013/09/13 15:14] – Schvaleno pro 1. verzi vaclavcvrcek
Řádek 3: Řádek 3:
 Parsing je proces, při němž se z věty jako posloupnosti slov, která jsou příp. [[pojmy:morfologicka_analyza|morfologicky analyzována]] a [[pojmy:desambiguace|desambiguována]], vytváří syntaktická struktura typicky v podobě závislostního nebo složkového stromu, což jsou zvláštní případy orientovaného grafu. Parsing vytváří korpusy syntakticky anotovaných struktur, tzv. //treebanky// (stromové databanky). Parsing je proces, při němž se z věty jako posloupnosti slov, která jsou příp. [[pojmy:morfologicka_analyza|morfologicky analyzována]] a [[pojmy:desambiguace|desambiguována]], vytváří syntaktická struktura typicky v podobě závislostního nebo složkového stromu, což jsou zvláštní případy orientovaného grafu. Parsing vytváří korpusy syntakticky anotovaných struktur, tzv. //treebanky// (stromové databanky).
  
-[{{ :pojmy:strom.png?direct&200|Obrázek bezprostředněsložkového stromu}}]+[{{ :pojmy:strom.png?direct&150|Obrázek bezprostředněsložkového stromu}}]
  
 V závislostním stromě každý uzel (příp. s výjimkou uzlů technických) reprezentuje jedno slovo, nejsou tu tedy žádné neterminální uzly. Některé uzly jsou spjaty závislostním vztahem (zachyceným tzv. hranou grafu). Je to vždy vztah binární mezi řídícím a závislým uzlem, přičemž hrana vede od řídícího uzlu k uzlu závislému (příp. i obráceně). Navíc je této hraně připsána hloubkově nebo povrchově syntaktická funkce příslušného syntaktického vztahu. Ve stromě, kde je syntaktická struktura věty vyjádřena bezprostředněsložkovým stromem, jsou mimo terminální uzly reprezentující jednotlivá slova věty i uzly neterminální zachycující syntaktické skupiny - fráze: např. nominální fráze, verbální fráze, klauze apod. Hrana v tomto stromě zachycuje vztah mezi složkou A a její bezprostřední složkou B. V závislostním stromě každý uzel (příp. s výjimkou uzlů technických) reprezentuje jedno slovo, nejsou tu tedy žádné neterminální uzly. Některé uzly jsou spjaty závislostním vztahem (zachyceným tzv. hranou grafu). Je to vždy vztah binární mezi řídícím a závislým uzlem, přičemž hrana vede od řídícího uzlu k uzlu závislému (příp. i obráceně). Navíc je této hraně připsána hloubkově nebo povrchově syntaktická funkce příslušného syntaktického vztahu. Ve stromě, kde je syntaktická struktura věty vyjádřena bezprostředněsložkovým stromem, jsou mimo terminální uzly reprezentující jednotlivá slova věty i uzly neterminální zachycující syntaktické skupiny - fráze: např. nominální fráze, verbální fráze, klauze apod. Hrana v tomto stromě zachycuje vztah mezi složkou A a její bezprostřední složkou B.
Řádek 14: Řádek 14:
  
 Obecněji je parser program, který na základě nějaké strukturní šablony (např. //DTD - Document Type Definition//) či gramatiky prověřuje, zda daný textový dokument má skutečně strukturu, kterou šablona či gramatika popisuje.  Obecněji je parser program, který na základě nějaké strukturní šablony (např. //DTD - Document Type Definition//) či gramatiky prověřuje, zda daný textový dokument má skutečně strukturu, kterou šablona či gramatika popisuje. 
 +
 +==== Související odkazy ====
 +
 +<WRAP round box 49%>
 +[[pojmy:desambiguace|Desambiguace]] • [[pojmy:tag|Tagování]] • [[pojmy:precision|Precision a recall]]
 +</WRAP>