Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
cnk:intercorp:verze13ud [2022/06/03 16:33] – [Syntaktické funkce] alexandrrosen | cnk:intercorp:verze13ud [2022/06/26 11:44] – [Příklady dotazů] alexandrrosen |
---|
==== Odkazy na řídící člen ==== | ==== Odkazy na řídící člen ==== |
| |
* Kromě odkazu na hlavu (''head'' jako slovosledné pořadí hlavy ve větě nebo ''parent'' jako její relativní pozice vůči danému členu) jsou u každého tokenu uvedeny i některé další atributy jeho hlavy: lemma (''p_lemma''), slovní druh (''p_upos''), morfologické kategorie (''p_feats'') a syntaktická funkce (''p_deprel''). | * Kromě odkazu na hlavu (''head'' jako slovosledné pořadí hlavy ve větě nebo ''parent'' jako její relativní pozice vůči danému slovu) jsou u každého tokenu uvedeny i některé další atributy jeho hlavy: lemma (''p_lemma''), slovní druh (''p_upos''), morfologické kategorie (''p_feats'') a syntaktická funkce (''p_deprel''). |
* Token může být vybaven i atributy, které specifikují vlastnosti pomocného slova, které na tokenu závisí. Např. lemma předložky uvádí atribut ''case_lemma'', morfologické kategorie pomocného slovesa atribut ''aux_feats'', morfologické kategorie spony atribut ''cop_feats'', slovní druh determinátoru atribut ''det_upos'', lemma podřadicí spojky atribut ''mark_lemma''. | * Token může být vybaven i atributy, které specifikují vlastnosti pomocného slova, které na tokenu závisí. Např. lemma předložky je určeno atributem ''case_lemma'', morfologické kategorie pomocného slovesa atributem ''aux_feats'', morfologické kategorie spony atributem ''cop_feats'', slovní druh determinátoru atributem ''det_upos'', lemma podřadicí spojky atributem ''mark_lemma''. |
* Podobné prostředky reprezentace syntaktické struktury používají i jiné syntakticky anotované korpusy zpřístupněné v prohlížeči KonText (např. ''syn2020''). | * Podobné prostředky reprezentace syntaktické struktury používají i jiné syntakticky anotované korpusy zpřístupněné v prohlížeči KonText (např. ''syn2020''). |
| |
* Mezi pomocná slova patří podle UD pomocná slovesa, předložky, podřadicí spojky, spona, determinátory a kvantifikátory. | * Mezi pomocná slova patří podle UD pomocná slovesa, předložky, podřadicí spojky, spona, determinátory a kvantifikátory. |
* Pomocná slova závisejí na příslušném slově významovém. | * Pomocná slova závisejí na příslušném slově významovém. |
* Druhy pomocných slov jsou určeny svou syntaktickou funkcí, tedy atributem ''deprel'': ''aux'' (pomocná slovesa), ''case'' (předložky), ''mark'' (podřadicí spojky), ''cop'' (spona), ''det'' (determinátor, člen) a ''clf'' (klasifikátor). | * Druhy pomocných slov jsou určeny svou syntaktickou funkcí, tedy hodnotou atributu ''deprel'': ''aux'' (pomocná slovesa), ''case'' (předložky), ''mark'' (podřadicí spojky), ''cop'' (spona), ''det'' (determinátor, člen) a ''clf'' (klasifikátory). |
* Za každé pomocné slovo může být u jeho řídícího slova významového uvedeno ''lemma'', ''upos'', ''feats'' a podrobnější specifikace druhu pomocného slova ''type'', např. ''%%aux_type="pass"%%'' (viz [[https://universaldependencies.org/cs/dep/aux-pass.html|passive auxiliary]]) nebo ''%%det_type="numgov"%%'' (viz [[https://universaldependencies.org/cs/dep/det-numgov.html|pronominal quantifier governing the case of the noun]]). | * Za každé pomocné slovo může být u jeho řídícího slova významového uvedeno ''lemma'', ''upos'', ''feats'' a podrobnější specifikace druhu pomocného slova ''type'', např. ''%%aux_type="pass"%%'' (viz [[https://universaldependencies.org/cs/dep/aux-pass.html|passive auxiliary]]) nebo ''%%det_type="numgov"%%'' (viz [[https://universaldependencies.org/cs/dep/det-numgov.html|pronominal quantifier governing the case of the noun]]). |
* Názvy příslušných atributů významového slova se skládají z funkce a atributu pomocného slova. Např. ''case_lemma'' specifikuje u substantiva nebo zájmena lemma předložky, ''aux_feats'' u slovesa významového specifikuje morfologické kategorie pomocného slovesa. | * Názvy příslušných atributů významového slova se skládají z funkce a atributu pomocného slova. Např. ''case_lemma'' specifikuje u substantiva nebo zájmena lemma předložky, ''aux_feats'' u slovesa významového specifikuje morfologické kategorie pomocného slovesa. |
* Spojka závisí na následujícím členu koordinace. Její syntaktická funkce je ''cc''. | * Spojka závisí na následujícím členu koordinace. Její syntaktická funkce je ''cc''. |
* K identifikaci hlavy bez ohledu na to, zda je token členem koordinace nebo zda je v ní na prvním nebo některém dalším místě, slouží odkaz na tzv. efektivní hlavu: atribut ''e_id'' odkazuje na její identifikátor (pořadové číslo tokenu představujícího hlavu v rámci věty), atribut ''eparent'' na její relativní pozici vůči danému tokenu. | * K identifikaci hlavy bez ohledu na to, zda je token členem koordinace nebo zda je v ní na prvním nebo některém dalším místě, slouží odkaz na tzv. efektivní hlavu: atribut ''e_id'' odkazuje na její identifikátor (pořadové číslo tokenu představujícího hlavu v rámci věty), atribut ''eparent'' na její relativní pozici vůči danému tokenu. |
* Chceme-li vyhledat všechna slova s určitou syntaktickou funkcí, včetně těch, které jsou součástí koordinace, můžeme využít atribut ''p_deprel'', který odkazuje na syntaktickou funkci hlavy daného tokenu. Např. dotaz na všechny nepřímé předměty, včetně koordinovaných, tak můžeme formulovat pomocí operátoru disjunkce (%%|%%) takto: ''%%[deprel="obj" | deprel="conj" & p_deprel="obj"]%%''. | * Chceme-li vyhledat všechna slova s určitou syntaktickou funkcí, včetně těch, které jsou součástí koordinace, můžeme využít atribut ''p_deprel'', který ukazuje syntaktickou funkci hlavy daného tokenu. Např. dotaz na všechny nepřímé předměty, včetně koordinovaných, tak můžeme formulovat pomocí operátoru disjunkce (%%|%%) takto: ''%%[deprel="obj" | deprel="conj" & p_deprel="obj"]%%''. |
| |
===== UD a KonText ===== | ===== UD a KonText ===== |
<code>[case="Dat" & deprel="obj" | case="Dat" & deprel="conj" & p_deprel="obj"]</code> | <code>[case="Dat" & deprel="obj" | case="Dat" & deprel="conj" & p_deprel="obj"]</code> |
| |
* [[https://www.korpus.cz/kontext/view?q=~3wGKQkuy2kE6|Tento dotaz]] najde přímé předměty v dativu, i když jsou součástí koordinace, např. ve větě //Chytil chřipku, **které** v novinách říkali "ruská".// | * [[https://www.korpus.cz/kontext/view?q=~3wGKQkuy2kE6|Tento dotaz]] najde přímé předměty v dativu, i když jsou součástí koordinace, např. ve větě //Chytil chřipku, **které** v novinách říkali "ruská".// nebo //Není jiná možnost, než je ukrást **mamce**, jejímu **manželovi** a **babičce**.// |
| * U koordinovaných předmětů je každý z nich v samostatné konkordanci. |
* Buď je v dativu s funkcí přímého předmětu klíčové slovo (''%%case="Dat" & deprel="obj"%%''), nebo má klíčové slovo v dativu (''%%case="Dat"%%'') funkci ''conj'' (''%%deprel="conj"%%'') a závisí na uzlu s funkcí přímého předmětu (''%%p_deprel="obj"%%''). To znamená, že je druhým nebo dalším členem koordinace, která má celá funkci ''obj''. | * Buď je v dativu s funkcí přímého předmětu klíčové slovo (''%%case="Dat" & deprel="obj"%%''), nebo má klíčové slovo v dativu (''%%case="Dat"%%'') funkci ''conj'' (''%%deprel="conj"%%'') a závisí na uzlu s funkcí přímého předmětu (''%%p_deprel="obj"%%''). To znamená, že je druhým nebo dalším členem koordinace, která má celá funkci ''obj''. |
| |