AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
cnk:dialekt:prace [2021/01/14 09:12] – [2.2 Vytváření dotazů pro vyhledávání -- příklady] Martina Waclawičovácnk:dialekt:prace [2022/04/22 08:29] (aktuální) – [2.1 Nastavení/zobrazení některých funkcí a parametrů] Michal Škrabal
Řádek 33: Řádek 33:
  
 === Přehrání zvukové stopy === === Přehrání zvukové stopy ===
-Pokud si chceme přehrát zvukovou stopu odpovídající přepisu, klikneme v konkordančním řádku na **modrou hranatou závorku** (ať už levou nebo pravou) a přehraje se nám příslušná část nahrávky odpovídající přepisu uvnitř závorek. Nahrávku si nelze přehrát ani stáhnout celou, pouze po jednotlivých úsecích v závorkách.+Pokud si chceme přehrát zvukovou stopu odpovídající přepisu, klikneme v konkordančním řádku na **modrou hranatou závorku** (ať už levou nebo pravou) a přehraje se nám příslušná část nahrávky odpovídající přepisu uvnitř závorek. Nahrávku si nelze přehrát ani stáhnout celou, pouze po jednotlivých úsecích v závorkách. Mnohem přehledněji lze repliky dialogu sledovat po kliknutí na KWIC v náhledovém režimu Promluvy.
  
 === Nastavení klávesnice s nářečními znaky === === Nastavení klávesnice s nářečními znaky ===
Řádek 50: Řádek 50:
   * Položka **Povolit regulární výrazy** zapnuta (tečka zastupuje jeden jakýkoli znak, hvězdička jeho libovolné opakování včetně nulového)   * Položka **Povolit regulární výrazy** zapnuta (tečka zastupuje jeden jakýkoli znak, hvězdička jeho libovolné opakování včetně nulového)
   * Dotaz: **b.* **    * Dotaz: **b.* ** 
-  * Třídění podle abecedy: **Konkordance -- Třídění -- word [dial]** – setřídí všechny výskyty (tvary, slova apod.) podle abecedy +  * Třídění podle abecedy: **Konkordance -- Třídění -- word [dial]** – setřídí všechny vyhledané doklady podle abecedy 
-  * Frekvence: **Frekvence -- Slovní tvary** – jednotlivé tvary seřadí podle frekvence +  * Frekvence: **Frekvence -- Slovní tvary** – zobrazí seznam tvarů seřazený podle frekvence 
-Dotaz lze omezit např. zadáním **ba.* ** apod., potom opět můžeme roztřídit buď podle abecedy, nebo podle frekvence tvarů.+Dotaz lze omezit např. zadáním **ba.* ** apod., potom opět můžeme roztřídit buď podle abecedy, nebo vytvořit seznam podle frekvence tvarů.
  
 Pozn 1: Pokud se vám při zadání některého z dotazů objeví hlášení ve znění: „Byl detekován možný nesoulad mezi zvoleným a faktickým typem dotazu. Chcete pokračovat?“, nevšímejte si ho a potvrďte možnost Hledat. Pozn 1: Pokud se vám při zadání některého z dotazů objeví hlášení ve znění: „Byl detekován možný nesoulad mezi zvoleným a faktickým typem dotazu. Chcete pokračovat?“, nevšímejte si ho a potvrďte možnost Hledat.
  
-Pozn 2: Chcete-li z vyhledaného výsledku dotazu vybrat např. určitý slovní druh nebo tvar, v menu nahoře zvolíme Filtr, dále vybereme Pozitivní. Objeví se okénko pro zadání dotazu, tj. toho, co chceme z vyhledaného výsledu vybrat. Pokud si např. přejeme všechna substantiva, omezíme filtr pouze na vyhledaná slova, tj. zadáme v okénku rozsah od 0 do 0. Přepneme na pokročilý dotaz a do vyhledávacího řádku zadáme [tag=%%"%%N.*%%"%%], kde N značí substantiva a .* znamená, že další pozice v tagu mohou být jakékoli, tj. jakýkoli tvar substantiva. (Pokud si chceme zobrazit u výsledku vyhledávání slovní druh, zvolíme v Zobrazení -- Korpusová nastavení ve sloupci Poziční atributy pos [part of speech].)+Pozn 2: Chcete-li z vyhledaného výsledku dotazu vybrat např. určitý slovní druh nebo tvar, v menu nahoře zvolíme Filtr, dále vybereme Pozitivní. Objeví se okénko pro zadání dotazu, tj. toho, co chceme z vyhledaného výsledu vybrat. Pokud si např. přejeme všechna substantiva, omezíme filtr pouze na vyhledaná slova, tj. zadáme v okénku pod možností Upřesnit parametry rozsah od 0 do 0. Přepneme na pokročilý dotaz a do vyhledávacího řádku zadáme [tag=%%"%%N.*%%"%%], kde N značí substantiva a .* znamená, že další pozice v tagu mohou být jakékoli, tj. jakýkoli tvar substantiva. (Pokud si chceme zobrazit u výsledku vyhledávání slovní druh, zvolíme v Zobrazení -- Korpusová nastavení v oddílu Poziční atributy pos [part of speech].)
  
 === Konkrétní slovní tvar === === Konkrétní slovní tvar ===
Řádek 77: Řádek 77:
 === Začátek slova === === Začátek slova ===
   * Výchozí atribut: **word [dial]**   * Výchozí atribut: **word [dial]**
-  * Dotaz (se zapnutím regulárních výrazů): **bál.* **+  * Položka **Povolit regulární výrazy** zapnuta 
 +  * Dotaz: **bál.* **
 Najde všechna slova, která začínají sledem znaků //bál//. Najde všechna slova, která začínají sledem znaků //bál//.
  
 === Část slova === === Část slova ===
   * Výchozí atribut: **word [dial]**   * Výchozí atribut: **word [dial]**
-  * Dotaz (se zapnutím regulárních výrazů): **.*bál.* **+  * Položka **Povolit regulární výrazy** zapnuta 
 +  * Dotaz: **.*bál.* **
 Najde všechna slova, která obsahují sled znaků //bál//. Najde všechna slova, která obsahují sled znaků //bál//.
  
Řádek 93: Řádek 95:
 === Konkrétní znak, např. všechna slova obsazující tvrdé ł === === Konkrétní znak, např. všechna slova obsazující tvrdé ł ===
   * Výchozí atribut: **word [dial]**   * Výchozí atribut: **word [dial]**
-  * Dotaz (se zapnutím regulárních výrazů): **.*ł.* **+  * Položka **Povolit regulární výrazy** zapnuta 
 +  * Dotaz: **.*ł.* **
  
 === Všechna slova končící na tvrdé ł === === Všechna slova končící na tvrdé ł ===
   * Výchozí atribut: **word [dial]**   * Výchozí atribut: **word [dial]**
-  * Dotaz (se zapnutím regulárních výrazů): **.*ł **+  * Položka **Povolit regulární výrazy** zapnuta 
 +  * Dotaz: **.*ł **
  
 === Všechna slova s příponou -hle === === Všechna slova s příponou -hle ===
   * Výchozí atribut: **word [dial]**   * Výchozí atribut: **word [dial]**
-  * Dotaz (se zapnutím regulárních výrazů): **.*hle **+  * Položka **Povolit regulární výrazy** zapnuta 
 +  * Dotaz: **.*hle **
 Vyhledá ale i slova končící na //-chle//, těch se můžeme zbavit pomocí negativního filtru. V menu nahoře zvolíme Filtr -- Negativní a do dotazového řádku napíšeme ''.*chle''. Vyhledá ale i slova končící na //-chle//, těch se můžeme zbavit pomocí negativního filtru. V menu nahoře zvolíme Filtr -- Negativní a do dotazového řádku napíšeme ''.*chle''.
  
 === Slovní spojení === === Slovní spojení ===
  
-Zkusme si nejprve v korpusu Dialekt_ort zadat sousloví //sousední vesnice//. S výchozím atributem **word[ort]** dostaneme jeden výsledek, zajímají-li nás však výskyty daného sousloví ve všech pádových formách a nehledě na číslo, musíme změnit atribut na **lemma**. Přibudou dva výskyty (//sousedních vesnicích// a //sousední vesnici//, tedy po jednom tvaru lokálu plurálu a singuláru). Avšak pozor! U sousloví je zapotřebí si uvědomit tvar lemmatu, tj. reprezentativní slovníkový tvar, všech složek, a ty pak zadat do hledacího řádku. Marně bychom jako lemma hledali např. sousloví //světová válka//, je nutno uvést lemmata obou slov, tzn. //světový válka// (jakkoliv podivně to vypadá), případně využít regulární výrazy: dotaz //světov.* vále?k.*// obsáhne veškeré tvary v rámci daného paradigmatu (vč. tvaru //válek//).+Zkusme si nejprve v korpusu **dialekt v1 - ort** zadat sousloví //sousední vesnice//. S výchozím atributem **word[ort]** dostaneme jeden výsledek, zajímají-li nás však výskyty daného sousloví ve všech pádových formách a nehledě na číslo, musíme změnit atribut na **lemma**. Přibudou dva výskyty (//sousedních vesnicích// a //sousední vesnici//, tedy po jednom tvaru lokálu plurálu a singuláru). Avšak pozor! U sousloví je zapotřebí si uvědomit tvar lemmatu, tj. reprezentativní slovníkový tvar, každé složky zvlášť a ty pak zadat do hledacího řádku. Marně bychom jako lemma hledali např. sousloví //světová válka//, je nutno uvést lemmata obou slov, tzn. //světový válka// (jakkoliv podivně to vypadá). Eventuelně je možné využít regulární výrazy: dotaz //světov.* vále?k.*// obsáhne veškeré tvary v rámci daného paradigmatu (vč. tvaru //válek//).
  
 ===== 3 Tipy pro práci se subkorpusy ===== ===== 3 Tipy pro práci se subkorpusy =====
  
-Pro vyhledávání si můžeme zúžit výběr nahrávek podle předem zvolených kritérií, a to buď pomocí funkce **Omezit hledání** nebo **vytvořením subkorpusu**. (V hlavním manuálu se o první možnosti dočtete v oddílu [[manualy:kontext:novy_dotaz#omezit_hledani|Omezit hledání]], v manuálu o mluvených korpusech [[kurz:hledani_v_mluvenych_korpusech#vyber_textu|zde]] a o subkorpusech se můžete informovat [[manualy:kontext:subkorpus|zde]].) +Pro vyhledávání si můžeme zúžit výběr nahrávek podle předem zvolených kritérií, a to buď pomocí funkce **Omezit hledání** nebo **vytvořením subkorpusu**. (V hlavním manuálu se o první možnosti dočtete v oddílu [[manualy:kontext:novy_dotaz#omezit_hledani|Omezit hledání]], v manuálu o mluvených korpusech [[kurz:hledani_v_mluvenych_korpusech#vyber_textu|zde]] a o subkorpusech se můžete informovat [[manualy:kontext:korpusy#prace_se_subkorpusy|zde]].) 
  
 Funkci **Omezit hledání** nalezneme na hlavní vyhledávací stránce dole. Pokud na ni klikneme, zobrazí se nám řada skupin parametrů, podle kterých lze vybírat typy nahrávek nebo mluvčích, v rámci kterých se bude vyhledávat. Funkci **Omezit hledání** nalezneme na hlavní vyhledávací stránce dole. Pokud na ni klikneme, zobrazí se nám řada skupin parametrů, podle kterých lze vybírat typy nahrávek nebo mluvčích, v rámci kterých se bude vyhledávat.
Řádek 117: Řádek 122:
  
 === Nastavení subkorpusu ===  === Nastavení subkorpusu === 
-Pro přihlášeného uživatele zůstane subkorpus trvale uložen. Nahoře v nabídce klikneme na položku **Korpusy** a potom na **Vytvořit nový subkorpus**. Objeví se nám pestrá škála parametrů, které se vyskytují i u funkce Omezit hledání.+Nahoře v nabídce klikneme na položku **Korpusy** a potom na **Vytvořit nový subkorpus**. Objeví se nám pestrá škála parametrů, které se vyskytují i u funkce Omezit hledání. Pro přihlášeného uživatele zůstane subkorpus trvale uložen.
  
 == Vytvoření subkorpusu z nahrávek publikovaných v Českém jazykovém atlasu == == Vytvoření subkorpusu z nahrávek publikovaných v Českém jazykovém atlasu ==
 Do prázdného okénka **Název nového subkorpusu** napíšeme název subkorpusu, jak si ho sami zvolíme, např. v tomto případě CJA. U položky **doc.zdroj** zaškrtneme možnost Ústav pro jazyk český AV ČR – ČJA a už jen zcela dole vlevo klikneme na příkaz **Vytvořit subkorpus**. Objeví se seznam subkorpusů a tam si můžeme subkorpus kliknutím zvolit.\\ Do prázdného okénka **Název nového subkorpusu** napíšeme název subkorpusu, jak si ho sami zvolíme, např. v tomto případě CJA. U položky **doc.zdroj** zaškrtneme možnost Ústav pro jazyk český AV ČR – ČJA a už jen zcela dole vlevo klikneme na příkaz **Vytvořit subkorpus**. Objeví se seznam subkorpusů a tam si můžeme subkorpus kliknutím zvolit.\\
-Náš vytvořený subkorpus najdeme tak, že v menu nahoře zvolíme **Korpusy** a dále **Mé subkorpusy** (subkorpus tam můžeme po zaškrtnutí okénka také smazat). Subkorpus lze vybrat z nabídky při zadávání dotazu – v menu nahoře zvolíme **Dotaz** a **Zadat nový dotaz** – a na stránce pro zadávání dotazu je vedle položky **Korpus: dialekt v1 – dial** také nabízející se položka **--celý korpus--**. Po kliknutí na ni se zobrazí i nabídka našich vytvořených subkorpusů. Potom už jen standardním způsobem zadáváme dotaz, kde bude vyhledávání omezeno jen na zvolený subkorpus.+Náš vytvořený subkorpus najdeme tak, že v menu nahoře zvolíme **Korpusy** a dále **Mé subkorpusy** (subkorpus tam můžeme po zaškrtnutí okénka také smazat). Subkorpus lze vybrat z nabídky při zadávání dotazu – v menu nahoře zvolíme **Dotaz** a **Zadat nový dotaz** – a na stránce pro zadávání dotazu je vedle položky **Korpus: dialekt v1 – dial** také nabízející se položka **--celý korpus--**. Po kliknutí na ni se zobrazí i nabídka našich vytvořených subkorpusů, z nichž můžeme kterýkoli zvolit. Potom už jen standardním způsobem zadáváme dotaz, kde bude vyhledávání omezeno jen na zvolený subkorpus.
  
 == Vytvoření subkorpusu ze starší vrstvy nahrávek == == Vytvoření subkorpusu ze starší vrstvy nahrávek ==
Řádek 134: Řádek 139:
  
 <WRAP round box 72%> <WRAP round box 72%>
-[[cnk:dialekt:pravidla|Transkripce v korpusu DIALEKT]] • [[cnk:dialekt:prace|Práce s korpusem DIALEKT]] • [[kurz:uvod|Kurz práce s korpusem]] • [[kurz:zaciname|Jak začít pracovat s Českým národním korpusem]] • [[kurz:hledani_v_paralelnim_korpusu|Specifika vyhledávání v paralelním korpusu]] • [[cnk:citace|Jak citovat]] • [[cnk:uvod|Korpusy ČNK]]+[[cnk:dialekt:pravidla|Transkripce v korpusu DIALEKT]] • [[kurz:uvod|Kurz práce s korpusem]] • [[kurz:zaciname|Jak začít pracovat s Českým národním korpusem]] • [[kurz:hledani_v_paralelnim_korpusu|Specifika vyhledávání v paralelním korpusu]] • [[cnk:citace|Jak citovat]] • [[cnk:uvod|Korpusy ČNK]]
 </WRAP> </WRAP>