Toto je starší verze dokumentu!
Obsah
Příklady vyhledávání frazémů v korpusu SYN
Níže uvádíme několik příkladů využití frazémové anotace při vyhledávání. K vyhledávání lze využít korpusy řady SYN, které frazémovou anotaci zahrnují ve verzích 4 až 8. Pro demonstraci používáme subkorpus SYN2015 v rámci korpusu SYN (verze 4).
Hledání podle kolokačního lemmatu
Úkol: Najděte všechny výskyty konkrétního frazému (např. obsahujícího substantivum označující část těla: přijít věci na kloub).
V „neofrazémovaném“ korpusu bychom zadali asi tyto dotazy:
[lemma="přijít"] [word=".*"]{0,5} [lemma="na"][lemma="kloub"]
[lemma="na"][lemma="kloub"][word=".*"]{0,5}[lemma="přijít"]
.
Ve frazeologicky označkovaném korpusu nalezneme všechny výskyty tohoto frazému dotazem
[col_lemma="přijít_na_kloub" & col_type=".*H"]
.
Chceme-li nalézt všechna rozšíření nebo varianty tohoto frazému, můžeme zadat dotaz [col_lemma=".*na_kloub" & col_type=".*H"]
.
Ke stejnému výsledku dojdeme také v syntakticky označkovaném korpusu SYN2015, zadáme-li dotaz [lemma="kloub" & prep="na" & e_lemma="přijít"]
a uděláme si frekvenční statistiku nalezených frazémů.
Hledání podle části frazému
Úkol: Najděte všechny výskyty homonymního slova tváří v označených ustálených kolokacích.
Řešení: [word="tváří" & col_type=".*[HZ]"]
Hledání přirovnání s konkrétním tvarem slova
Úkol: Najděte v korpusu všechna přirovnání, v kterých vystupuje slovní forma myslí jednou jako sloveso, podruhé jako substantivum.
Řešení:
[word="myslí" & tag="V.*" & col_lemma="..*"]
[word="myslí" & tag="N.*" & col_lemma="..*"]
Hledání slovesné fráze s konkrétním substantivem
Úkol: Vyhledejte všechny slovesné frazémy obsahující slovo slina.
Řešení: [lemma="slina" & col_type="V[HZ]"]
Hledání nominální fráze s konkrétním adjektivem
Úkol: Nalezněte ustálené spojení se substantivem, které je rozvito zleva adjektivem černý.
Řešení: [lemma="černý" & col_type="KZ"]
Porovnáme-li výsledky s dotazem [lemma="bílý" & col_type="KZ"]
, resp. [lemma="bílý" & col_lemma="bíl.*" & col_type="KZ"]
, získáme některá spojení s odlišnými substantivy.
Hledání všech frazeologických užití daného paradigmatu
Úkol: Vyhledejte všechny frazémy, jejichž součástí je sloveso lámat.
Řešení: [lemma="lámat" & col_type=".*[ZH]"]
Hledání podle slovnědruhového vzoru
Úkol: Najděte v korpusu přísloví, které obsahuje spojení číslovky a substantiva.
Řešení: [tag="Cl.*" & col_type="M.*"][tag="NN.*" & col_type="M.*"]
Úkol: Vyhledejte případy, kdy je v některém z frazémů porušeno gramatické pravidlo, že předložka nepředchází před slovesem.
Řešení: [tag="R.*" & col_type="..*"][tag="V.*" & col_type="..*"]
V subkorpusu SYN2015 se zobrazí 36 výskytů adverbiálního spojení od nevidím do nevidím.