Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
pojmy:parser [2016/01/21 12:19]
Václav Cvrček Odkaz
pojmy:parser [2021/01/18 11:06] (aktuální)
Tomáš Jelínek [Parsing]
Řádek 3: Řádek 3:
 Parsing je proces, při němž se z věty jako posloupnosti slov, která jsou příp. [[pojmy:morfologicka_analyza|morfologicky analyzována]] a [[pojmy:desambiguace|desambiguována]], vytváří syntaktická struktura typicky v podobě závislostního nebo složkového stromu, což jsou zvláštní případy orientovaného grafu. Parsing vytváří korpusy syntakticky anotovaných struktur, tzv. //treebanky// (stromové databanky). Parsing je proces, při němž se z věty jako posloupnosti slov, která jsou příp. [[pojmy:morfologicka_analyza|morfologicky analyzována]] a [[pojmy:desambiguace|desambiguována]], vytváří syntaktická struktura typicky v podobě závislostního nebo složkového stromu, což jsou zvláštní případy orientovaného grafu. Parsing vytváří korpusy syntakticky anotovaných struktur, tzv. //treebanky// (stromové databanky).
  
-[{{ :pojmy:strom.png?direct&150|Obrázek bezprostředněsložkového stromu}}]+[{{ :pojmy:strom.png?direct&150|Obrázek závislostního stromu}}]
  
 V závislostním stromě každý uzel (příp. s výjimkou uzlů technických) reprezentuje jedno slovo, nejsou tu tedy žádné neterminální uzly. Některé uzly jsou spjaty závislostním vztahem (zachyceným tzv. hranou grafu). Je to vždy vztah binární mezi řídícím a závislým uzlem, přičemž hrana vede od řídícího uzlu k uzlu závislému (příp. i obráceně). Navíc je této hraně připsána hloubkově nebo povrchově syntaktická funkce příslušného syntaktického vztahu. Ve stromě, kde je syntaktická struktura věty vyjádřena bezprostředněsložkovým stromem, jsou mimo terminální uzly reprezentující jednotlivá slova věty i uzly neterminální zachycující syntaktické skupiny - fráze: např. nominální fráze, verbální fráze, klauze apod. Hrana v tomto stromě zachycuje vztah mezi složkou A a její bezprostřední složkou B. V závislostním stromě každý uzel (příp. s výjimkou uzlů technických) reprezentuje jedno slovo, nejsou tu tedy žádné neterminální uzly. Některé uzly jsou spjaty závislostním vztahem (zachyceným tzv. hranou grafu). Je to vždy vztah binární mezi řídícím a závislým uzlem, přičemž hrana vede od řídícího uzlu k uzlu závislému (příp. i obráceně). Navíc je této hraně připsána hloubkově nebo povrchově syntaktická funkce příslušného syntaktického vztahu. Ve stromě, kde je syntaktická struktura věty vyjádřena bezprostředněsložkovým stromem, jsou mimo terminální uzly reprezentující jednotlivá slova věty i uzly neterminální zachycující syntaktické skupiny - fráze: např. nominální fráze, verbální fráze, klauze apod. Hrana v tomto stromě zachycuje vztah mezi složkou A a její bezprostřední složkou B.
  
-Jednotlivým uzlům stromu jsou tu přiřazeny dva údaje: slovní tvar a syntaktická funkce charakterizující závislostní vztah mezi řídícím a závislým uzlem: podřízený uzel závisí na svém řídícím uzlu typem (zde povrchověsyntaktické) závislosti připsaným závislému uzlu. Parsing se provádí ručně nebo automaticky parserem, který je buď [[wp>Stochastic#Language_and_linguistics|stochastický]], nebo je založený na pravidlech. +Jednotlivým uzlům stromu jsou tu přiřazeny dva údaje: slovní tvar a syntaktická funkce charakterizující závislostní vztah mezi řídícím a závislým uzlem: podřízený uzel závisí na svém řídícím uzlu typem (zde povrchověsyntaktické) závislosti připsaným závislému uzlu. Parsing se provádí ručně nebo automaticky parserem, který je buď [[wp>Stochastic#Language_and_linguistics|stochastický]] (založený na strojovém učení), nebo je založený na pravidlech (takových parserů je ale málo, žádný spolehlivý pravidlový parser pro češtinu nebyl vytvořen). 
 + 
 +Syntaktická anotace korpusu [[cnk:syn2015|SYN2015]] byla provedena parserem [[http://www.cs.cmu.edu/~afm/Home_files/acl2013short.pdf|TurboParser]], anotace korpusu [[cnk:syn2020|SYN2020]] parserem Stack-Pointer Parser z řady nástrojů [[https://arxiv.org/abs/1805.01087|NeuroNLP 2]].
  
 ===== Parser ===== ===== Parser =====