Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata [2020/12/22 19:23] – [Sublemmata zvláštního druhu stupňování (sebe-)] jankrivan | cnk:syn2020:seznamy:pokrocily_dotaz_sublemmata [2021/02/03 12:58] (aktuální) – jankrivan |
---|
Na této stránce jsou zveřejněny tipy, jak dále prozkoumávat variantnost v SYN2020 pomocí konceptu sublemmatu. | Na této stránce jsou zveřejněny tipy, jak dále prozkoumávat variantnost v SYN2020 pomocí konceptu sublemmatu. |
| |
* Všechna variantní sublemmata lze teoreticky vyhledat pomocí dotazu:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma%%''\\ tedy najdi jakýkoliv tvar, jehož sublemma se nerovná lemmatu. Přímo tento dotaz však nedoporučujeme, jeho výpočet je velmi náročný a příliš zatěžuje server. Dotaz je tedy potřeba dále zpřesňovat. | Všechna variantní sublemmata lze teoreticky vyhledat pomocí dotazu:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma%%''\\ tedy najdi jakýkoliv tvar, jehož sublemma se nerovná lemmatu. Tento dotaz však nedoporučujeme používat přímo, neboť jeho výpočet je velmi náročný a příliš zatěžuje server. Dotaz je tedy potřeba dále zpřesňovat. |
| |
| Rady, jak vyhledávat jednotlivé typy sublemmat uvádíme níže. Po provedení každé vyhledávky doporučujeme zobrazit výsledky v rozhraní Kontext pomocí frekvenční distribuce (typ //vlastní...// se zobrazením atributů ''lemma'' a ''sublemma''). |
| |
Rady jak vyhledávat jednotlivé typy sublemmat uvádíme níže. Po provedení každé vyhledávky doporučujeme zobrazit výsledky v rozhraní Kontext pomocí frekvenční distribuci (typ //vlastní...// se zobrazením atributů ''lemma'' a ''sublemma''). | |
==== Hlásková a ortografická variantnost apelativ ==== | ==== Hlásková a ortografická variantnost apelativ ==== |
| |
Při hledání sublemmat apelativ je dobré dotaz upravit nejprve tak, aby se eliminovala propria:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se rovná lemmatu (v němž se rozlišuje velikost písmen). | Při hledání sublemmat apelativ je dobré dotaz upravit nejprve tak, aby se eliminovala propria:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se rovná lemmatu (v němž se rozlišuje velikost písmen). |
| |
Další úprava spočívá v tom, že eliminujeme z vyhledávání pravidelné tvary označené sublemmaty, která sama o sobě nezakládají ortografickou či hláskovou variantnost, tedy sublemmata negace. \\ ''%%1:[tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ | Další úprava spočívá v tom, že eliminujeme z vyhledávání pravidelné tvary označené sublemmaty, která sama o sobě nezakládají ortografickou či hláskovou variantnost, tedy sublemmata negace:\\ ''%%1:[tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ |
| |
Do tohoto dotazu lze následně vepisovat jednotlivé zkoumané hláskové změny, např. | Do tohoto dotazu lze následně vepisovat jednotlivé zkoumané alternace, např. |
| |
* Najdi kandidáty hláskové změny -ý/-ej uprostřed slova:\\ ''%%1:[lemma=".+ý.+" & sublemma=".+ej.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' | * Najdi kandidáty hláskové alternace //-ý/-ej// uprostřed slova:\\ ''%%1:[lemma=".+ý.+" & sublemma=".+ej.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' |
| |
* Najdi kandidáty ortografické změny -z/-s uprostřed nebo na konci slova:\\ ''%%1:[lemma=".+z.*" & sublemma=".+s.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' | * Najdi kandidáty ortografické alternace //-z/-s// uprostřed nebo na konci slova:\\ ''%%1:[lemma=".+z.*" & sublemma=".+s.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' |
| |
* Najdi kandidáty hláskové změny -i/-í na začátku nebo uprostřed slova:\\ ''%%1:[lemma=".*i.+" & sublemma=".*í.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' | * Najdi kandidáty hláskové alternace //-i/-í// na začátku nebo uprostřed slova:\\ ''%%1:[lemma=".*i.+" & sublemma=".*í.+" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' |
| |
* Najdi kandidáty hláskové změny -d/-ď kdekoliv ve slově:\\ ''%%1:[lemma=".*d.*" & sublemma=".*ď.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' | * Najdi kandidáty hláskové alternace //-d/-ď// kdekoliv ve slově:\\ ''%%1:[lemma=".*d.*" & sublemma=".*ď.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%'' |
| |
Uvedené dotazy vygenerují naprostou většinu relevantních výsledků. U dalších alternací ale může být i více výsledků nechtěných, např. tímto způsobem zadaný dotaz na ortografickou změnu -k/-c: \\ | Uvedené dotazy vygenerují naprostou většinu relevantních výsledků. U dalších alternací ale může být i více výsledků nechtěných, např. tímto způsobem zadaný dotaz na ortografickou změnu //-k/-c//: \\ |
''%%1:[lemma=".*k.*" & sublemma=".*c.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ | ''%%1:[lemma=".*k.*" & sublemma=".*c.*" & tag!="..........N.*"] & 1.sublemma!=1.lemma & 1.lemma_lc=1.lemma%%''\\ |
najde i řadu slov, v nichž se vyskytují souběžně //c// a //k// a je v nich zároveň nějaká další změna (např. dvojici //cokoli//%%/%%//cokoliv//). Další filtrování a zpřesňování dotazu už záleží na potřebách uživatele. | najde i řadu slov, v nichž se vyskytují souběžně //c// a //k// a je v nich zároveň nějaká další změna (např. dvojici //cokoli//%%/%%//cokoliv//). Další filtrování a zpřesňování dotazu už záleží na potřebách uživatele. |
==== Sublemmata zvláštního druhu stupňování (sebe-) ==== | ==== Sublemmata zvláštního druhu stupňování (sebe-) ==== |
| |
* Sublemmata adjektiv (např. //sebedůležitější//): \\ ''%%1:[tag="A........1.*" & sublemma="sebe.*" & lemma!="sebe.*"]''\\ | * Sublemmata adjektiv (např. //sebedůležitější//): \\ ''%%[tag="A........1.*" & sublemma="sebe.*" & lemma!="sebe.*"]%%'' |
* Sublemmata adverbií (např. //sebešetrněji//): \\ ''%%1:[tag="Db.*" & sublemma="sebe.*" & lemma!="sebe.*"]'' | * Sublemmata adverbií (např. //sebešetrněji//): \\ ''%%[tag="Db.*" & sublemma="sebe.*" & lemma!="sebe.*"]%%'' |
| |
==== Sublemmata u neohebných slovních druhů a zájmen ==== | ==== Sublemmata u neohebných slovních druhů a zájmen ==== |
* Variantní sublemmata u zájmen: \\ ''%%1:[tag="P.*"] & 1.sublemma!=1.lemma%%'' | * Variantní sublemmata u zájmen: \\ ''%%1:[tag="P.*"] & 1.sublemma!=1.lemma%%'' |
| |
* Variantní sublemmata u nestupňovatelných (tj. nedeadjektivních) adverbií:\\ ''%%1:[tag="Db.*" & sublemma!="sebe.*"] & 1.sublemma!=1.lemma%%''\\ (v dotazu je potřeba eliminovat tvary adverbií se zvláštním stupňováním, které mají také tag ''Db.*'') | * Variantní sublemmata u nestupňovatelných adverbií:\\ ''%%1:[tag="Db.*" & sublemma!="sebe.*"] & 1.sublemma!=1.lemma%%''\\ v dotazu je potřeba eliminovat tvary adverbií se zvláštním stupňováním, které mají také tag ''Db.*'' |
| |
| |
==== Sublemmata u proprií ==== | ==== Sublemmata u proprií ==== |
| |
U proprií je postup stejný jako u apelativ s tím rozdílem, že formuli zpřesníme takto:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma%%''\\ tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se nerovná lemmatu (v němž se rozlišuje velikost písmen). | U proprií je postup vyhledávání stejný jako u apelativ s tím rozdílem, že formuli zpřesníme takto:\\ ''%%1:[word=".*"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma%%''\\ tedy najdi jakékoliv variantní sublemma, jehož lemma psané malými písmeny se nerovná lemmatu (v němž se rozlišuje velikost písmen). |
| |
Příklad: | Příklad: |
| |
* Pokud chceme hledat variantní jména/názvy ženského rodu, ale nikoliv variantní příjmení, dotaz lze uvést např. takto:\\ ''%%1:[tag="NNF.*" & lemma!=".*[cs]ká"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma%%'' | * Pokud chceme hledat variantní jména/názvy ženského rodu, ale nikoliv variantní příjmení, lze dotaz uvést např. takto:\\ ''%%1:[tag="NNF.*" & lemma!=".*[cs]ká"] & 1.sublemma!=1.lemma & 1.lemma_lc!=1.lemma%%'' |
| |
| |
| \\ |
| %%%% >> [[cnk:syn2020|Zpět na hlavní stránku Korpus SYN2020]]\\ |
| %%%% >> [[cnk:syn2020:seznamy|Všechny seznamy slov SYN2020]]\\ |
| %%%% >> [[cnk:syn2020:lemmatizace|Lemmatizace SYN2020]]\\ |