AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
seznamy:index [2026/01/26 00:26] – [Hodnoty pozičních atributů] krivanseznamy:index [2026/01/27 16:53] (aktuální) – [Hodnoty pozičních atributů] jankrivan
Řádek 19: Řádek 19:
  
   * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], [[seznamy:parent|parent]], [[seznamy:eparent|eparent]], [[seznamy:ord|ord]], [[seznamy:prep|prep]], [[seznamy:p_tag|atributy odvozené od řídících tokenů]])   * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], [[seznamy:parent|parent]], [[seznamy:eparent|eparent]], [[seznamy:ord|ord]], [[seznamy:prep|prep]], [[seznamy:p_tag|atributy odvozené od řídících tokenů]])
-  * [[seznamy:mwe|značky víceslovných lexikálních jednotek]] (atributy ''mwe_lemma'', ''mwe_tag'')[[seznamy:frazemy|dřívější frazémové značky]] (atributy ''col_lemma'', ''col_type'')+  * [[seznamy:mwe|značky víceslovných lexikálních jednotek]] <fs x-small>databáze LEMUR</fs> (atributy ''mwe_lemma'', ''mwe_tag'') 
 +  * [[seznamy:frazemy|dřívější značky víceslovných lexikálních jednotek]] <fs x-small>nástroj FRANTA</fs> (atributy ''col_lemma'', ''col_type'')
  
 == Anotace různých transkripčních vrstev v mluvených korpusech == == Anotace různých transkripčních vrstev v mluvených korpusech ==
Řádek 25: Řádek 26:
   * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy ''fon'', ''ort'', ''dial'', ''uid'')   * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy ''fon'', ''ort'', ''dial'', ''uid'')
  
-== Tokenizace a lemmatizace v aktuálních korpusech ==+== Tokenizace a lemmatizace v korpusech ==
  
   * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut ''word'')   * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut ''word'')