| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| seznamy:index [2026/01/26 00:23] – [Hodnoty pozičních atributů] krivan | seznamy:index [2026/01/27 16:53] (aktuální) – [Hodnoty pozičních atributů] jankrivan |
|---|
| * [[seznamy:verbtagy|značky gramatických kategorií slovesa]] (atribut ''verbtag'') | * [[seznamy:verbtagy|značky gramatických kategorií slovesa]] (atribut ''verbtag'') |
| |
| == Syntaktická a frazémová anotace == | == Syntaktická anotace a anotace víceslovných lexikálních jednotek == |
| |
| * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], [[seznamy:parent|parent]], [[seznamy:eparent|eparent]], [[seznamy:ord|ord]], [[seznamy:p_tag|atributy odvozené od řídících tokenů]], [[seznamy:prep|prep]]) | * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], [[seznamy:parent|parent]], [[seznamy:eparent|eparent]], [[seznamy:ord|ord]], [[seznamy:prep|prep]], [[seznamy:p_tag|atributy odvozené od řídících tokenů]]) |
| * [[seznamy:mwe|frazémové značky]] (atributy ''mwe_lemma'', ''mwe_tag'') [[seznamy:frazemy|frazémové značky]] (atributy ''col_lemma'', ''col_type'') | * [[seznamy:mwe|značky víceslovných lexikálních jednotek]] <fs x-small>databáze LEMUR</fs> (atributy ''mwe_lemma'', ''mwe_tag'') |
| | * [[seznamy:frazemy|dřívější značky víceslovných lexikálních jednotek]] <fs x-small>nástroj FRANTA</fs> (atributy ''col_lemma'', ''col_type'') |
| |
| == Anotace různých transkripčních vrstev v mluvených korpusech == | == Anotace různých transkripčních vrstev v mluvených korpusech == |
| * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy ''fon'', ''ort'', ''dial'', ''uid'') | * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy ''fon'', ''ort'', ''dial'', ''uid'') |
| |
| == Tokenizace a lemmatizace v aktuálních korpusech == | == Tokenizace a lemmatizace v korpusech == |
| |
| * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut ''word'') | * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut ''word'') |