AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata [2020/12/22 19:29] – [Sublemmata u proprií] jankrivancnk:syn2020:seznamy:pokrocily_dotaz_sublemmata [2021/02/03 12:58] (aktuální) jankrivan
Řádek 3: Řádek 3:
 Na této stránce jsou zveřejněny tipy, jak dále prozkoumávat variantnost v SYN2020 pomocí konceptu sublemmatu. Na této stránce jsou zveřejněny tipy, jak dále prozkoumávat variantnost v SYN2020 pomocí konceptu sublemmatu.
  
-  * Všechna variantní sublemmata lze teoreticky vyhledat pomocí dotazu:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma%%''\\ tedy najdi jakýkoliv tvar, jehož sublemma se nerovná lemmatu. Přímo tento dotaz však nedoporučujeme, jeho výpočet je velmi náročný a příliš zatěžuje server. Dotaz je tedy potřeba dále zpřesňovat.+Všechna variantní sublemmata lze teoreticky vyhledat pomocí dotazu:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma%%''\\ tedy najdi jakýkoliv tvar, jehož sublemma se nerovná lemmatu. Tento dotaz však nedoporučujeme používat přímoneboť jeho výpočet je velmi náročný a příliš zatěžuje server. Dotaz je tedy potřeba dále zpřesňovat
 + 
 +Rady, jak vyhledávat jednotlivé typy sublemmat uvádíme níže. Po provedení každé vyhledávky doporučujeme zobrazit výsledky v rozhraní Kontext pomocí frekvenční distribuce (typ //vlastní...// se zobrazením atributů ''lemma'' a ''sublemma'').
  
-Rady jak vyhledávat jednotlivé typy sublemmat uvádíme níže. Po provedení každé vyhledávky doporučujeme zobrazit výsledky v rozhraní Kontext pomocí frekvenční distribuci (typ //vlastní...// se zobrazením atributů ''lemma'' a ''sublemma''). 
 ==== Hlásková a ortografická variantnost apelativ ==== ==== Hlásková a ortografická variantnost apelativ ====
  
 Při hledání sublemmat apelativ je dobré dotaz upravit nejprve tak, aby se eliminovala propria:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se rovná lemmatu (v němž se rozlišuje velikost písmen). Při hledání sublemmat apelativ je dobré dotaz upravit nejprve tak, aby se eliminovala propria:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se rovná lemmatu (v němž se rozlišuje velikost písmen).
  
-Další úprava spočívá v tom, že eliminujeme z vyhledávání pravidelné tvary označené sublemmaty, která sama o sobě nezakládají ortografickou či hláskovou variantnost, tedy sublemmata negace\\ ''%%1:[tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\+Další úprava spočívá v tom, že eliminujeme z vyhledávání pravidelné tvary označené sublemmaty, která sama o sobě nezakládají ortografickou či hláskovou variantnost, tedy sublemmata negace:\\ ''%%1:[tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\
  
-Do tohoto dotazu lze následně vepisovat jednotlivé zkoumané hláskové změny, např.+Do tohoto dotazu lze následně vepisovat jednotlivé zkoumané alternace, např.
  
-  * Najdi kandidáty hláskové změny -ý/-ej uprostřed slova:\\ ''%%1:[lemma=".+ý.+" & sublemma=".+ej.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' +  * Najdi kandidáty hláskové alternace //-ý/-ej// uprostřed slova:\\ ''%%1:[lemma=".+ý.+" & sublemma=".+ej.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' 
  
-  * Najdi kandidáty ortografické změny -z/-s uprostřed nebo na konci slova:\\ ''%%1:[lemma=".+z.*" & sublemma=".+s.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''+  * Najdi kandidáty ortografické alternace //-z/-s// uprostřed nebo na konci slova:\\ ''%%1:[lemma=".+z.*" & sublemma=".+s.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''
  
-  * Najdi kandidáty hláskové změny -i/-í na začátku nebo uprostřed slova:\\ ''%%1:[lemma=".*i.+" & sublemma=".*í.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''+  * Najdi kandidáty hláskové alternace //-i/-í// na začátku nebo uprostřed slova:\\ ''%%1:[lemma=".*i.+" & sublemma=".*í.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''
  
-  * Najdi kandidáty hláskové změny -d/-ď kdekoliv ve slově:\\ ''%%1:[lemma=".*d.*" & sublemma=".*ď.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''+  * Najdi kandidáty hláskové alternace //-d/-ď// kdekoliv ve slově:\\ ''%%1:[lemma=".*d.*" & sublemma=".*ď.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''
  
-Uvedené dotazy vygenerují naprostou většinu relevantních výsledků. U dalších alternací ale může být i více výsledků nechtěných, např. tímto způsobem zadaný dotaz na ortografickou změnu -k/-c: \\+Uvedené dotazy vygenerují naprostou většinu relevantních výsledků. U dalších alternací ale může být i více výsledků nechtěných, např. tímto způsobem zadaný dotaz na ortografickou změnu //-k/-c//: \\
 ''%%1:[lemma=".*k.*" & sublemma=".*c.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ ''%%1:[lemma=".*k.*" & sublemma=".*c.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\
 najde i řadu slov, v nichž se vyskytují souběžně //c// a //k// a je v nich zároveň nějaká další změna (např. dvojici //cokoli//%%/%%//cokoliv//). Další filtrování a zpřesňování dotazu už záleží na potřebách uživatele. najde i řadu slov, v nichž se vyskytují souběžně //c// a //k// a je v nich zároveň nějaká další změna (např. dvojici //cokoli//%%/%%//cokoliv//). Další filtrování a zpřesňování dotazu už záleží na potřebách uživatele.
Řádek 45: Řádek 46:
   * Variantní sublemmata u zájmen: \\ ''%%1:[tag="P.*"] & 1.sublemma!=1.lemma%%''   * Variantní sublemmata u zájmen: \\ ''%%1:[tag="P.*"] & 1.sublemma!=1.lemma%%''
  
-  * Variantní sublemmata u nestupňovatelných (tj. nedeadjektivních) adverbií:\\ ''%%1:[tag="Db.*" & sublemma!="sebe.*"] & 1.sublemma!=1.lemma%%''\\ (v dotazu je potřeba eliminovat tvary adverbií se zvláštním stupňováním, které mají také tag ''Db.*'')+  * Variantní sublemmata u nestupňovatelných adverbií:\\ ''%%1:[tag="Db.*" & sublemma!="sebe.*"] & 1.sublemma!=1.lemma%%''\\ v dotazu je potřeba eliminovat tvary adverbií se zvláštním stupňováním, které mají také tag ''Db.*''
  
  
Řádek 54: Řádek 55:
 Příklad: Příklad:
  
-  * Pokud chceme hledat variantní jména/názvy ženského rodu, ale nikoliv variantní příjmení, dotaz lze uvést např. takto:\\ ''%%1:[tag="NNF.*" & lemma!=".*[cs]ká"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma%%''+  * Pokud chceme hledat variantní jména/názvy ženského rodu, ale nikoliv variantní příjmení, lze dotaz uvést např. takto:\\ ''%%1:[tag="NNF.*" & lemma!=".*[cs]ká"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma%%''