AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
pojmy:ud [2022/08/13 12:43] – [Příklady dotazů] alexandrrosenpojmy:ud [2023/07/05 12:44] – [Chyby a nedostatky lingvistické anotace podle UD] alexandrrosen
Řádek 233: Řádek 233:
 <code>[case="Acc" & case_lemma="o"]</code>  <code>[case="Acc" & case_lemma="o"]</code> 
  
-  * [[https://www.korpus.cz/kontext/view?q=~w4OmGg4oSYkq|Tento dotaz]] najde všechna jména, tj. slova, která se skloňují (mají pád), tedy substantiva, zájmena a adjektiva; pádem má být akuzativ a dané jméno následuje po předložce //o// (lemma závislého pomocného slova se syntaktickou funkcí ''case'' je //o//).+  * [[https://www.korpus.cz/kontext/view?q=~0AwsQAG8Y4Sg|Tento dotaz]] najde všechna jména, tj. slova, která se skloňují (mají pád), tedy substantiva, zájmena a adjektiva; pádem má být akuzativ a dané jméno následuje po předložce //o// (lemma závislého pomocného slova se syntaktickou funkcí ''case'' je //o//).
   * Najdeme tak např. větu //Dědovy holínky **pleskaly** o dlaždičky.//   * Najdeme tak např. větu //Dědovy holínky **pleskaly** o dlaždičky.//
   * Vzhledem k tomu, že údaj o předložce bývá uveden jen u substantiv nebo zájmen, ve výsledku by se adjektiva neměla objevit.    * Vzhledem k tomu, že údaj o předložce bývá uveden jen u substantiv nebo zájmen, ve výsledku by se adjektiva neměla objevit. 
Řádek 368: Řádek 368:
   * Zásady jednotné klasifikace jevů se neuplatňují ve všech jazycích stejně důsledně.    * Zásady jednotné klasifikace jevů se neuplatňují ve všech jazycích stejně důsledně. 
   * Chyby a nedůslednosti v daném jazyce (např. //udělals// jako jednodílný token).   * Chyby a nedůslednosti v daném jazyce (např. //udělals// jako jednodílný token).
 +  * Ve verzi 13ud je v němčině u sloves i osobních zájmen kategorie osoby často určena nesprávně, např. //siehst// nebo //du// je podle anotace 1. nebo 3. osoba. UDPipe se takhle mýlí i ve verzi 2 podle modelu german-hdt-ud-2.10-220711. Model german-gsd-ud-2.10-220711 to má správně.
  
 Kvalita anotace v různých jazycích se liší zejména objemem a kvalitou trénovacích dat. Má na ni vliv i metoda a nástroj použitý k anotaci. Kvalita anotace v různých jazycích se liší zejména objemem a kvalitou trénovacích dat. Má na ni vliv i metoda a nástroj použitý k anotaci.