AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verzeObě strany příští revize
kurz:hledani_frazemy [2018/08/13 13:48] michalskrabalkurz:hledani_frazemy [2018/08/13 14:05] michalskrabal
Řádek 1: Řádek 1:
  
-<fs large>**Jak tomu přijít na kloub**</fs> +====== íklady vyhledávání frazémů ======
-  +
-**Proč některé výskyty frazémů nebo ustálených kolokací nejsou automaticky označené?** +
- +
-A) doposud nebyla ještě daná kolokace zpracovaná a zařazena do vyhledávání a označení v korpusu +
- +
-B) Text je chybně morfologicky diasmbiguovaný, proto se daný výskyt kolokace neidentifikoval. +
- +
-C) příslušná kolokace nebyla zařazeno do programu identifikace, protože automaticky nelze spolehlivě určit, který výskyt daného řetězce slov v textu má hledaný přenesený význam. +
- +
-**Jaké je riziko, že označené výskyty nejsou frazeologické?** (chyby v automatickém označení frazémů) +
- +
-Frazeologický význam se realizuje jeho výskytem ve frazému. Označování frazémů probíhá automaticky, proto v případě některých obecných slovních spojením je velké riziko, že automaticky, jenom podle výskytu daného řetězce slov v textu, nelze spolehlivě určit, zda se jedná o přenesený frazeologický význam. +
- +
-Pozor tedy na **frazeologický** a **doslovný** význam slova:\\ +
-frazeologizmus popisující např. náladu sportovního týmu po těžké porážce +
-- col_lemma="lízat_si_rány"\\ +
-//Po odjezdu policistů <fc #ff0000>si</fc> pomlácení baseballisté před klubem <fc #ff0000>lízali rány</fc>, ...// +
- +
-Případů výskytu tohoto spojení v doslovném významu je v psaných textech opravdu málo:\\ +
-//Kocour <fc #ff0000>si líže rány</fc>, které mu způsobil sousedův pes.// +
- +
-Oproti tomu ustálené slovní spojení:\\ +
-col_lemma="jít_na_porážku"\\ +
-//Už ráno bylo zřejmé, že ODS <fc #ff0000>jde na porážku</fc>.// +
- +
-se v textu častěji používá v doslovném významu:\\ +
-//Nejvýkonnější dojnice <fc #ff0000>jdou</fc> běžně <fc #ff0000>na porážku</fc> už po dvou nebo třech obdobích březosti.// +
- +
-**Chybovost automatického označování frazémů.** +
- +
-Automatické označování ustálených kolokací probíhá  bez jakékoliv znalosti syntaktické struktury a valence, je proto u některých hesel (zejména u dvouslovných nesouvislých slovesných frazémů) riziko, že  u těchto nesouvislých frazémů mohou nastat problémy s jeho identifikací. vyhledávání hesel //mít figuru//, //mít frčku//, //mít náladu//, //mít právo// apod. jsou označeny i falešné výskyty, např.: +
- +
-//Kdy jindy by se <fc #ff0000>měly</fc> zúročit všechny snahy o dokonalou  <fc #ff0000>figuru</fc>, ...//\\ +
-//V březnu roku 1872 <fc #ff0000>měl</fc> Myslbek v sádře hotovou jednu  <fc #ff0000>figuru</fc> a rozpracovanou protější.//\\ +
-//... každý, kdo <fc #ff0000>měl</fc> alespoň o jednu tu <fc #ff0000>frčku</fc> navíc, ...//\\ +
-//Bulharský premiér Borisov <fc #ff0000>měl</fc> pro dobrou <fc #ff0000>náladu</fc> důvod.//\\ +
-//<fc #ff0000>Mám</fc> advokátní praxi zaměřenou na rodinné <fc #ff0000>právo</fc>.//\\ +
-//...nevěděli, koho <fc #ff0000>mají</fc>  na toto <fc #ff0000>právo</fc> upozornit//\\ +
-//... v demokratické společnosti  <fc #ff0000>má</fc> každý <fc #ff0000>právo</fc>  na své <fc #ff0000>právo</fc>//  +
- +
-Případné mezení při vyhledávání těchto frazémů, že mezi slovy frazému se nenachází předložka, by zamezilo označení frazeologických výskytů ve větách: +
- +
-//... koneckonců <fc #ff0000>má</fc> na svůj obraz nějaké <fc #ff0000>právo</fc>, jenom to nikoho nezajímá.//\\ +
-//<fc #ff0000>Nemám</fc> na tohle všechno <fc #ff0000>právo</fc>.// +
-+
- +
- +
  
-<fs large>**íklady vyhledávání frazémů**</fs>\\ +=== íklad 1. Hledání konkrétního ustáleného slovního spojení (podle kolokačního lemmatu) ===
-Problémy vyhledávání obtížných typů a jevů+
  
-**Příklad 1. Vyhledání konkrétního ustáleného slovního spojení** (podle kolokačního lemmatu) 
  
 Najděte všechny výskyty konkrétního frazému (například obsahujícího substantivum označující část těla nebo jiného ustáleného spojení slov), například: //přijít věci na kloub// Najděte všechny výskyty konkrétního frazému (například obsahujícího substantivum označující část těla nebo jiného ustáleného spojení slov), například: //přijít věci na kloub//
Řádek 67: Řádek 17:
  
  
-Chceme-li nalézt všechny rozšíření nebo varianty tohoto frazému, můžeme zadat dotaz: [col_lemma=%%".*na_kloub"%% & col_type=%%".*H"%%]+Chceme-li nalézt všechna rozšíření nebo varianty tohoto frazému, můžeme zadat dotaz: [col_lemma=%%".*na_kloub"%% & col_type=%%".*H"%%]
  
 {{:seznamy:na_kloub.png?|}} {{:seznamy:na_kloub.png?|}}
  
-Ke stejnému výsledku dojdeme také v syntakticky označkovaném korpusu SYN2015, kdy zadáme dotaz: [lemma=%%"kloub"%% & prep=%%"na"%% & e_lemma=%%"přijít"%%] a vypíšeme si/uděláme statistiku nalezených frazémů+Ke stejnému výsledku dojdeme také v syntakticky označkovaném korpusu SYN2015, zadáme-li dotaz: [lemma=%%"kloub"%% & prep=%%"na"%% & e_lemma=%%"přijít"%%] a vypíšeme si/uděláme statistiku nalezených frazémů
  
-**Příklad 2. Vyhledání všech výskytů daného slova v automaticky označených frazémech** (podle formy)+=== Příklad 2. Hledání všech výskytů daného slova v automaticky označených frazémech (podle formy) ===
  
 Najděte všechny výskyty homonymního slova //tváří// v označených ustálených kolokacích Najděte všechny výskyty homonymního slova //tváří// v označených ustálených kolokacích
Řádek 82: Řádek 32:
  
  
-**Příklad 3. Přirovnání s konkrétním tvarem slova** (vyhledávání podle formy a slovního druhu)+=== Příklad 3. Hledání přirovnání s konkrétním tvarem slova (podle formy a slovního druhu) ===
  
-Najděte v korpusu všechna přirovnání, v kterých je slovo-forma //myslí// jednou jako sloveso, podruhé jako substantivum.+Najděte v korpusu všechna přirovnání, v kterých vystupuje slovní forma //myslí// jednou jako sloveso, podruhé jako substantivum.
  
 ''[word=%%"myslí"%% & tag=%%"V.*"%% & col_lemma=%%"..*"%%]''\\ ''[word=%%"myslí"%% & tag=%%"V.*"%% & col_lemma=%%"..*"%%]''\\
Řádek 91: Řádek 41:
 {{:seznamy:dotaz3-1.png|}}  {{:seznamy:dotaz3-2.png|}} {{:seznamy:dotaz3-1.png|}}  {{:seznamy:dotaz3-2.png|}}
  
-**Příklad 4. Slovesná fráze s konkrétním substantivem** (vyhledávání podle lemmatu a typu kolokace)+=== Příklad 4. Hledání slovesné fráze s konkrétním substantivem (podle lemmatu a typu kolokace) ===
  
 Vyhledejte všechny slovesné frazémy se slovem //slina//. Vyhledejte všechny slovesné frazémy se slovem //slina//.
Řádek 99: Řádek 49:
 {{:seznamy:dotaz4.png|}} {{:seznamy:dotaz4.png|}}
  
-**Příklad 5. Nominální fráze s konkrétním adjektivem** (vyhledávání podle lemmatu a tagu)+=== Příklad 5. Hledání nominální fráze s konkrétním adjektivem (podle lemmatu a tagu) ===
  
 Nalezněte ustálené spojení se substantivem, které je rozvito zleva adjektivem //černý// (varianta s rozvitím adjektivem //bílý// se většinou nevyskytuje)\\ Nalezněte ustálené spojení se substantivem, které je rozvito zleva adjektivem //černý// (varianta s rozvitím adjektivem //bílý// se většinou nevyskytuje)\\
Řádek 112: Řádek 62:
  
  
-**Příklad 6. Vyhledání všech frazeologických užití daného paradigmatu** (vyhledání podle lemmatu)+=== Příklad 6. Hledání všech frazeologických užití daného paradigmatu (podle lemmatu) ===
  
 Vyhledejte všechny frazémy, jejichž součástí je sloveso //lámat//. Vyhledejte všechny frazémy, jejichž součástí je sloveso //lámat//.
Řádek 120: Řádek 70:
 {{:seznamy:dotaz6.png|}} {{:seznamy:dotaz6.png|}}
  
-**íklady a 8Vyhledávání podle slovnědruhového vzoru**\\+=== íklad 7. Hledání podle slovnědruhového vzoru ===
  
 Zajímavá jsou i slovnědruhová složení některých frazémů. Najděte v korpusu přísloví, které obsahuje spojení:\\  Zajímavá jsou i slovnědruhová složení některých frazémů. Najděte v korpusu přísloví, které obsahuje spojení:\\