| Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
| seznamy:index [2026/01/26 00:26] – [Hodnoty pozičních atributů] krivan | seznamy:index [2026/01/27 16:53] (aktuální) – [Hodnoty pozičních atributů] jankrivan |
|---|
| |
| * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], [[seznamy:parent|parent]], [[seznamy:eparent|eparent]], [[seznamy:ord|ord]], [[seznamy:prep|prep]], [[seznamy:p_tag|atributy odvozené od řídících tokenů]]) | * [[seznamy:syntakticke_znacky|syntaktické značky]] (atributy [[seznamy:afun|afun, p_afun, ep_afun]], [[seznamy:parent|parent]], [[seznamy:eparent|eparent]], [[seznamy:ord|ord]], [[seznamy:prep|prep]], [[seznamy:p_tag|atributy odvozené od řídících tokenů]]) |
| * [[seznamy:mwe|značky víceslovných lexikálních jednotek]] (atributy ''mwe_lemma'', ''mwe_tag''), [[seznamy:frazemy|dřívější frazémové značky]] (atributy ''col_lemma'', ''col_type'') | * [[seznamy:mwe|značky víceslovných lexikálních jednotek]] <fs x-small>databáze LEMUR</fs> (atributy ''mwe_lemma'', ''mwe_tag'') |
| | * [[seznamy:frazemy|dřívější značky víceslovných lexikálních jednotek]] <fs x-small>nástroj FRANTA</fs> (atributy ''col_lemma'', ''col_type'') |
| |
| == Anotace různých transkripčních vrstev v mluvených korpusech == | == Anotace různých transkripčních vrstev v mluvených korpusech == |
| * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy ''fon'', ''ort'', ''dial'', ''uid'') | * [[seznamy:mluvene_atributy|značky transkripčních vrstev]] (atributy ''fon'', ''ort'', ''dial'', ''uid'') |
| |
| == Tokenizace a lemmatizace v aktuálních korpusech == | == Tokenizace a lemmatizace v korpusech == |
| |
| * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut ''word'') | * [[cnk:syn2020:tokenizace|tokenizace numerických a interpunkčních znaků v korpusu SYN2020]] (má vliv zejména na atribut ''word'') |