Nastavení

Příklady vyhledávání frazémů v korpusu SYN2015

Níže uvádíme několik příkladů využití frazémové anotace při vyhledávání. Vzhledem k tomu, že frazémová anotace není dostupná ve všech korpusech, pro demonstraci používáme korpusu SYN2015. K vyhledávání lze nicméně využít také korpusy řady SYN, které frazémovou anotaci zahrnují od verze 4.

Hledání podle kolokačního lemmatu

Úkol: Najděte všechny výskyty konkrétního frazému (např. obsahujícího substantivum označující část těla: přijít věci na kloub).

V „neofrazémovaném“ korpusu bychom zadali asi tyto dotazy:

[lemma="přijít"] [word=".*"]{0,5} [lemma="na"][lemma="kloub"]
[lemma="na"][lemma="kloub"][word=".*"]{0,5}[lemma="přijít"].

Ve frazeologicky označkovaném korpusu nalezneme všechny výskyty tohoto frazému dotazem
[col_lemma="přijít_na_kloub" & col_type=".*H"].

Chceme-li nalézt všechna rozšíření nebo varianty tohoto frazému, můžeme zadat dotaz [col_lemma=".*na_kloub" & col_type=".*H"].

Ke stejnému výsledku dojdeme také v syntakticky označkovaném korpusu SYN2015, zadáme-li dotaz [lemma="kloub" & prep="na" & e_lemma="přijít"] a uděláme si frekvenční statistiku nalezených frazémů.

Hledání podle části frazému

Úkol: Najděte všechny výskyty homonymního slova tváří v označených ustálených kolokacích.

Řešení: [word="tváří" & col_type=".*[HZ]"]

Hledání přirovnání s konkrétním tvarem slova

Úkol: Najděte v korpusu všechna přirovnání, v kterých vystupuje slovní forma myslí jednou jako sloveso, podruhé jako substantivum.

Řešení:
[word="myslí" & tag="V.*" & col_lemma="..*"]
[word="myslí" & tag="N.*" & col_lemma="..*"]

Hledání slovesné fráze s konkrétním substantivem

Úkol: Vyhledejte všechny slovesné frazémy obsahující slovo slina.

Řešení: [lemma="slina" & col_type="V[HZ]"]

Hledání nominální fráze s konkrétním adjektivem

Úkol: Nalezněte ustálené spojení se substantivem, které je rozvito zleva adjektivem černý.

Řešení: [lemma="černý" & col_type="KZ"]

Porovnáme-li výsledky s dotazem [lemma="bílý" & col_type="KZ"], resp. [lemma="bílý" & col_lemma="bíl.*" & col_type="KZ"], získáme některá spojení s odlišnými substantivy.

Hledání všech frazeologických užití daného paradigmatu

Úkol: Vyhledejte všechny frazémy, jejichž součástí je sloveso lámat.

Řešení: [lemma="lámat" & col_type=".*[ZH]"]

Hledání podle slovnědruhového vzoru

Úkol: Najděte v korpusu přísloví, které obsahuje spojení číslovky a substantiva.

Řešení: [tag="Cl.*" & col_type="M.*"][tag="NN.*" & col_type="M.*"]

Úkol: Vyhledejte případy, kdy je v některém z frazémů porušeno gramatické pravidlo, že předložka nepředchází před slovesem.

Řešení: [tag="R.*" & col_type="..*"][tag="V.*" & col_type="..*"]

V korpusu SYN2015 se zobrazí 36 výskytů adverbiálního spojení od nevidím do nevidím.