Toto je starší verze dokumentu!
Příklady vyhledávání frazémů v korpusu SYN2015
Příklad 1. Hledání konkrétního ustáleného slovního spojení (podle kolokačního lemmatu)
Úkol: Najděte všechny výskyty konkrétního frazému (např. obsahujícího substantivum označující část těla: přijít věci na kloub).
V „neofrazémovaném“ korpusu bychom zadali asi tyto dotazy:
[lemma="přijít"] [word=".*"]{0,5} [lemma="na"][lemma="kloub"]
[lemma="na"][lemma="kloub"][word=".*"]{0,5}[lemma="přijít"]
.
Ve frazeologicky označkovaném korpusu nalezneme všechny výskyty tohoto frazému dotazem
[col_lemma="přijít_na_kloub" & col_type=".*H"]
.
Chceme-li nalézt všechna rozšíření nebo varianty tohoto frazému, můžeme zadat dotaz [col_lemma=".*na_kloub" & col_type=".*H"]
.
Ke stejnému výsledku dojdeme také v syntakticky označkovaném korpusu SYN2015, zadáme-li dotaz [lemma="kloub" & prep="na" & e_lemma="přijít"]
a uděláme si frekvenční statistiku nalezených frazémů.
Příklad 2. Hledání všech výskytů daného slova v automaticky označených frazémech (podle formy)
Úkol: Najděte všechny výskyty homonymního slova tváří v označených ustálených kolokacích.
Řešení: [word="tváří" & col_type=".*[HZ]"]
Příklad 3. Hledání přirovnání s konkrétním tvarem slova (podle formy a slovního druhu)
Úkol: Najděte v korpusu všechna přirovnání, v kterých vystupuje slovní forma myslí jednou jako sloveso, podruhé jako substantivum.
Řešení:
[word="myslí" & tag="V.*" & col_lemma="..*"]
[word="myslí" & tag="N.*" & col_lemma="..*"]
Příklad 4. Hledání slovesné fráze s konkrétním substantivem (podle lemmatu a typu kolokace)
Úkol: Vyhledejte všechny slovesné frazémy obsahující slovo slina.
Řešení: [lemma="slina" & col_type="V[HZ]"]
Příklad 5. Hledání nominální fráze s konkrétním adjektivem (podle lemmatu a tagu)
Úkol: Nalezněte ustálené spojení se substantivem, které je rozvito zleva adjektivem černý.
Řešení: [lemma="černý" & col_type="KZ"]
Porovnáme-li výsledky s dotazem [lemma="bílý" & col_type="KZ"]
, resp. [lemma="bílý" & col_lemma="bíl.*" & col_type="KZ"]
, získáme některá spojení s odlišnými substantivy.
Příklad 6. Hledání všech frazeologických užití daného paradigmatu (podle lemmatu)
Úkol: Vyhledejte všechny frazémy, jejichž součástí je sloveso lámat.
Řešení: [lemma="lámat" & col_type=".*[ZH]"]
Příklad 7. Hledání podle slovnědruhového vzoru
Úkol: Najděte v korpusu přísloví, které obsahuje spojení číslovky a substantiva.
Řešení: [tag="Cl.*" & col_type="M.*"][tag="NN.*" & col_type="M.*"]
Úkol: Vyhledejte případy, kdy je v některém z frazémů porušeno gramatické pravidlo, že předložka nepředchází před slovesem.
Řešení: [tag="R.*" & col_type="..*"][tag="V.*" & col_type="..*"]
V korpusu SYN2015 se zobrazí 36 výskytů adverbiálního spojení od nevidím do nevidím.