AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Poslední revizeObě strany příští revize
pojmy:atributy_pozicni [2015/12/17 10:42] vaclavcvrcekpojmy:atributy_pozicni [2021/11/02 15:11] – [Poziční atributy] michalskrabal
Řádek 13: Řádek 13:
   * [[seznamy:eparent|eparent]] - pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý   * [[seznamy:eparent|eparent]] - pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý
   * [[seznamy:p_tag|p_tag, p_lemma]] - tag a lemma řídícího tokenu    * [[seznamy:p_tag|p_tag, p_lemma]] - tag a lemma řídícího tokenu 
-  * ep_tag, ep_lemma - totéž jako ''p_tag'' a ''p_lemma'', ale pouze u autosémantických slov +  * [[seznamy:p_tag|ep_tag, ep_lemma]] - totéž jako ''p_tag'' a ''p_lemma'', ale pouze u autosémantických slov 
   * [[seznamy:prep|prep]] - u jmen řízených předložkou uvádí lemma předložky   * [[seznamy:prep|prep]] - u jmen řízených předložkou uvádí lemma předložky
  
 Mezi méně využívané poziční atributy patří: Mezi méně využívané poziční atributy patří:
-  * lc - (z angl. //lowercase//ekvivalent slovního tvarukterý ovšem zanedbává velikost písmen +  * lc - (z angl. //lowercase//slovní tvar malými písmeny (odvozen z atributu ''word''
-  * pos - (z angl. //part of speech//značka slovního druhu +  * lemma_lc - (z angl. //lemma in lowercase//) lemma malými písmeny (odvozeno z atributu ''lemma''
-  * [[seznamy:proc|proc]] - informace o typu nástroje, který je zodpovědný za [[pojmy:desambiguace|disambiguaci]]+  * sublemma - pravopisnáhlásková či morfologická varianta lemmatu 
 +  * pos - (z angl. //part of speech//slovní druh (odvozen z atributu [[pojmy:tag|tag]]) 
 +  * case - pád (odvozen z atributu [[pojmy:tag|tag]]) 
 +  * [[cnk:syn2020:verbtag|verbtag]] - slovesné gramatické kategorie 
 +  * [[seznamy:proc|proc]] - informace o konkrétním procesu, který je zodpovědný za [[pojmy:desambiguace|disambiguaci]]
  
-Specifické jsou atributy, které vznikají derivací z morfologické značky+Následující atributy byly již v ČNK nahrazeny atributy ''pos'' a ''case''v novějších korpusech se tedy nevyskytují
-  * k - vyjadřuje slovní druh, identický s první pozicí morfologického tagu +  * k - slovní druh (odvozen z atributu [[pojmy:tag|tag]]) 
-  * g - vyjadřuje jmenný rod, identický s třetí pozicí morfologického tagu +  * g - jmenný rod (odvozen z atributu [[pojmy:tag|tag]]) 
-  * c - vyjadřuje pád, identický s pátou pozicí morfologického tagu +  * c - pád (odvozen z atributu [[pojmy:tag|tag]])
-Tyto tagy jsou užívány při analýze slovních profilů ([[pojmy:korpusovy_manazer#sketch_engine|Word Sketches]]) a téměř nemají další praktické uplatnění.+
  
-Různé korpusy můžou mít rozdílnou sadu pozičních atributů v závislosti na propracovanosti anotace a výzkumných cílech, s nimiž byl daný korpus vytvářen.+**Různé korpusy mají typicky rozdílnou sadu pozičních atributů** v závislosti na propracovanosti anotace a výzkumných cílech, s nimiž byl daný korpus vytvářen.
  
 ==== Související odkazy ==== ==== Související odkazy ====