AplikaceAplikace
Nastavení

Toto je starší verze dokumentu!


Pokročilé dotazy pro vyhledání variantních sublemmat v SYN2020

Na této stránce jsou zveřejněny tipy, jak dále prozkoumávat variantnost v SYN2020 pomocí konceptu sublemmatu.

  • Všechna variantní sublemmata lze teoreticky vyhledat pomocí dotazu:
    1:[word=".*"] & 1.sublemma!=1.lemma
    tedy najdi jakýkoliv tvar, jehož sublemma se nerovná lemmatu. Přímo tento dotaz však nedoporučujeme, jeho výpočet je velmi náročný a příliš zatěžuje server. Dotaz je tedy potřeba dále zpřesňovat.

Rady jak vyhledávat jednotlivé typy sublemmat uvádíme níže. Po provedení každé vyhledávky doporučujeme zobrazit výsledky v rozhraní Kontext pomocí frekvenční distribuci (typ vlastní… se zobrazením atributů lemma a sublemma).

Hlásková a ortografická variantnost apelativ

Při hledání sublemmat apelativ je dobré dotaz upravit nejprve tak, aby se eliminovala propria:
1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma
tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se rovná lemmatu (v němž se rozlišuje velikost písmen).

Další úprava spočívá v tom, že eliminujeme z vyhledávání pravidelné tvary označené sublemmaty, která sama o sobě nezakládají ortografickou či hláskovou variantnost, tedy sublemmata negace.
1:[tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma

Do tohoto dotazu lze následně vepisovat jednotlivé zkoumané hláskové změny, např.

  • Najdi kandidáty hláskové změny -ý/-ej uprostřed slova:
    1:[lemma=".+ý.+" & sublemma=".+ej.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma
  • Najdi kandidáty ortografické změny -z/-s uprostřed nebo na konci slova:
    1:[lemma=".+z.*" & sublemma=".+s.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma
  • Najdi kandidáty hláskové změny -i/-í na začátku nebo uprostřed slova:
    1:[lemma=".*i.+" & sublemma=".*í.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma
  • Najdi kandidáty hláskové změny -d/-ď kdekoliv ve slově:
    1:[lemma=".*d.*" & sublemma=".*ď.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma

Uvedené dotazy vygenerují naprostou většinu relevantních výsledků. U dalších alternací ale může být i více výsledků nechtěných, např. tímto způsobem zadaný dotaz na ortografickou změnu -k/-c:
1:[lemma=".*k.*" & sublemma=".*c.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma
najde i řadu slov, v nichž se vyskytují souběžně c a k a je v nich zároveň nějaká další změna (např. dvojici cokoli/cokoliv). Další filtrování a zpřesňování dotazu už záleží na potřebách uživatele.

Sublemmata zvláštního druhu stupňování (sebe-)

  • Sublemmata adjektiv (např. sebedůležitější):
    1:[tag="A........1.*" & sublemma="sebe.*" & lemma!="sebe.*"] & 1.sublemma!=1.lemma
  • Sublemmata adverbií (např. sebešetrněji):
    1:[tag="Db.*" & sublemma="sebe.*"] & 1.sublemma!=1.lemma

Sublemmata u neohebných slovních druhů a zájmen

Sublemmata u jednotlivých slovních druhů lze v kombinaci se základním dotazem nalézt celkem snadno:

  • Variantní sublemmata u spojek:
    1:[tag="J.*"] & 1.sublemma!=1.lemma
  • Variantní sublemmata u předložek:
    1:[tag="R.*"] & 1.sublemma!=1.lemma
  • Variantní sublemmata u částic:
    1:[tag="T.*"] & 1.sublemma!=1.lemma
  • Variantní sublemmata u citoslovcí:
    1:[tag="I.*"] & 1.sublemma!=1.lemma
  • Variantní sublemmata u zájmen:
    1:[tag="P.*"] & 1.sublemma!=1.lemma
  • Variantní sublemmata u nestupňovatelných (tj. nedeadjektivních) adverbií:
    1:[tag="Db.*" & sublemma!="sebe.*"] & 1.sublemma!=1.lemma
    (v dotazu je potřeba eliminovat tvary adverbií se zvláštním stupňováním, které mají také tag Db.*)

Sublemmata u proprií

U proprií je postup stejný jako u apelativ s tím rozdílem, že formuli zpřesníme takto:
1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma
tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se nerovná lemmatu (v němž se rozlišuje velikost písmen).

Příklad:

  • Pokud chceme hledat variantní jména/názvy ženského rodu, ale nikoliv variantní příjmení, dotaz lze uvést např. takto:
    1:[tag="NNF.*" & lemma!=".*[cs]ká"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma