Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize |
pojmy:atributy_pozicni [2015/12/17 10:42] – vaclavcvrcek | pojmy:atributy_pozicni [2021/11/02 15:11] – [Poziční atributy] michalskrabal |
---|
* [[seznamy:eparent|eparent]] - pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý | * [[seznamy:eparent|eparent]] - pouze u autosémantických slov; vyjadřuje relativní pozici nejbližšího autosémantického tokenu, na němž je daný token závislý |
* [[seznamy:p_tag|p_tag, p_lemma]] - tag a lemma řídícího tokenu | * [[seznamy:p_tag|p_tag, p_lemma]] - tag a lemma řídícího tokenu |
* ep_tag, ep_lemma - totéž jako ''p_tag'' a ''p_lemma'', ale pouze u autosémantických slov | * [[seznamy:p_tag|ep_tag, ep_lemma]] - totéž jako ''p_tag'' a ''p_lemma'', ale pouze u autosémantických slov |
* [[seznamy:prep|prep]] - u jmen řízených předložkou uvádí lemma předložky | * [[seznamy:prep|prep]] - u jmen řízených předložkou uvádí lemma předložky |
| |
Mezi méně využívané poziční atributy patří: | Mezi méně využívané poziční atributy patří: |
* lc - (z angl. //lowercase//) ekvivalent slovního tvaru, který ovšem zanedbává velikost písmen | * lc - (z angl. //lowercase//) slovní tvar malými písmeny (odvozen z atributu ''word'') |
* pos - (z angl. //part of speech//) značka slovního druhu | * lemma_lc - (z angl. //lemma in lowercase//) lemma malými písmeny (odvozeno z atributu ''lemma'') |
* [[seznamy:proc|proc]] - informace o typu nástroje, který je zodpovědný za [[pojmy:desambiguace|disambiguaci]] | * sublemma - pravopisná, hlásková či morfologická varianta lemmatu |
| * pos - (z angl. //part of speech//) slovní druh (odvozen z atributu [[pojmy:tag|tag]]) |
| * case - pád (odvozen z atributu [[pojmy:tag|tag]]) |
| * [[cnk:syn2020:verbtag|verbtag]] - slovesné gramatické kategorie |
| * [[seznamy:proc|proc]] - informace o konkrétním procesu, který je zodpovědný za [[pojmy:desambiguace|disambiguaci]] |
| |
Specifické jsou atributy, které vznikají derivací z morfologické značky: | Následující atributy byly již v ČNK nahrazeny atributy ''pos'' a ''case'', v novějších korpusech se tedy nevyskytují: |
* k - vyjadřuje slovní druh, identický s první pozicí morfologického tagu | * k - slovní druh (odvozen z atributu [[pojmy:tag|tag]]) |
* g - vyjadřuje jmenný rod, identický s třetí pozicí morfologického tagu | * g - jmenný rod (odvozen z atributu [[pojmy:tag|tag]]) |
* c - vyjadřuje pád, identický s pátou pozicí morfologického tagu | * c - pád (odvozen z atributu [[pojmy:tag|tag]]) |
Tyto tagy jsou užívány při analýze slovních profilů ([[pojmy:korpusovy_manazer#sketch_engine|Word Sketches]]) a téměř nemají další praktické uplatnění. | |
| |
Různé korpusy můžou mít rozdílnou sadu pozičních atributů v závislosti na propracovanosti anotace a výzkumných cílech, s nimiž byl daný korpus vytvářen. | **Různé korpusy mají typicky rozdílnou sadu pozičních atributů** v závislosti na propracovanosti anotace a výzkumných cílech, s nimiž byl daný korpus vytvářen. |
| |
==== Související odkazy ==== | ==== Související odkazy ==== |