Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- seznamy:index [2026/01/26 00:26] – [Hodnoty pozičních atributů] krivan
+++ seznamy:index [2026/01/27 16:53] (aktuální) – [Hodnoty pozičních atributů] jankrivan
@@ Řádek 19: / Řádek 19: @@
   * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], [[seznamy:parent|parent]], [[seznamy:eparent|eparent]], [[seznamy:ord|ord]], [[seznamy:prep|prep]], [[seznamy:p_tag|atributy odvozené od řídících tokenů]])
-  * [[seznamy:mwe|značky víceslovných lexikálních jednotek]] (atributy ''mwe_lemma'', ''mwe_tag''), [[seznamy:frazemy|dřívější frazémové značky]] (atributy ''col_lemma'', ''col_type'')
+  * [[seznamy:mwe|značky víceslovných lexikálních jednotek]] <fs x-small>databáze LEMUR</fs> (atributy ''mwe_lemma'', ''mwe_tag'')
+  * [[seznamy:frazemy|dřívější značky víceslovných lexikálních jednotek]] <fs x-small>nástroj FRANTA</fs> (atributy ''col_lemma'', ''col_type'')
 == Anotace různých transkripčních vrstev v mluvených korpusech ==
@@ Řádek 25: / Řádek 26: @@
   * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy ''fon'', ''ort'', ''dial'', ''uid'')
-== Tokenizace a lemmatizace v aktuálních korpusech ==
+== Tokenizace a lemmatizace v korpusech ==
   * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut ''word'')

Historie: