Níže uvádíme několik příkladů využití frazémové anotace při vyhledávání. Vzhledem k tomu, že frazémová anotace není dostupná ve všech korpusech, pro demonstraci jsme použili zvláštní verzi frazeologicky označkovaného korpusu SYN2015. K uživatelskému vyhledávání lze využít korpusy řady SYN, které frazémovou anotaci zahrnují od verze 4.
Úkol: Najděte všechny výskyty konkrétního frazému (např. obsahujícího substantivum označující část těla: přijít věci na kloub).
V „neofrazémovaném“ korpusu bychom zadali asi tyto dotazy:
[lemma="přijít"] [word=".*"]{0,5} [lemma="na"][lemma="kloub"]
[lemma="na"][lemma="kloub"][word=".*"]{0,5}[lemma="přijít"]
.
Ve frazeologicky označkovaném korpusu nalezneme všechny výskyty tohoto frazému dotazem
[col_lemma="přijít_na_kloub" & col_type=".*H"]
.
Chceme-li nalézt všechna rozšíření nebo varianty tohoto frazému, můžeme zadat dotaz [col_lemma=".*na_kloub" & col_type=".*H"]
.
Ke stejnému výsledku dojdeme také v syntakticky označkovaném korpusu SYN2015, zadáme-li dotaz [lemma="kloub" & prep="na" & e_lemma="přijít"]
a uděláme si frekvenční statistiku nalezených frazémů.
Úkol: Najděte všechny výskyty homonymního slova tváří v označených ustálených kolokacích.
Řešení: [word="tváří" & col_type=".*[HZ]"]
Úkol: Najděte v korpusu všechna přirovnání, v kterých vystupuje slovní forma myslí jednou jako sloveso, podruhé jako substantivum.
Řešení:
[word="myslí" & tag="V.*" & col_lemma="..*"]
[word="myslí" & tag="N.*" & col_lemma="..*"]
Úkol: Vyhledejte všechny slovesné frazémy obsahující slovo slina.
Řešení: [lemma="slina" & col_type="V[HZ]"]
Úkol: Nalezněte ustálené spojení se substantivem, které je rozvito zleva adjektivem černý.
Řešení: [lemma="černý" & col_type="KZ"]
Porovnáme-li výsledky s dotazem [lemma="bílý" & col_type="KZ"]
, resp. [lemma="bílý" & col_lemma="bíl.*" & col_type="KZ"]
, získáme některá spojení s odlišnými substantivy.
Úkol: Vyhledejte všechny frazémy, jejichž součástí je sloveso lámat.
Řešení: [lemma="lámat" & col_type=".*[ZH]"]
Úkol: Najděte v korpusu přísloví, které obsahuje spojení číslovky a substantiva.
Řešení: [tag="Cl.*" & col_type="M.*"][tag="NN.*" & col_type="M.*"]
Úkol: Vyhledejte případy, kdy je v některém z frazémů porušeno gramatické pravidlo, že předložka nepředchází před slovesem.
Řešení: [tag="R.*" & col_type="..*"][tag="V.*" & col_type="..*"]
Zobrazí se 36 výskytů adverbiálního spojení od nevidím do nevidím.