Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize | ||
cnk:dialekt:prace [2018/02/13 11:54] – [2.2 Vytváření dotazů pro vyhledávání – příklady] golanova | cnk:dialekt:prace [2021/01/14 09:37] – [3 Tipy pro práci se subkorpusy] martinawaclawicova | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== 1 Práce s korpusem Dialekt ====== | ====== 1 Práce s korpusem Dialekt ====== | ||
- | Následující text přináší tipy pro základní práci s korpusem [[cnk: | + | Následující text přináší tipy pro základní práci s korpusem [[cnk: |
- | Korpus Dialekt | + | Korpus Dialekt |
=== Volba korpusu === | === Volba korpusu === | ||
- | Po přihlášení do KonTextu nejprve vybereme korpus, který představuje požadovanou úroveň přepisu korpusu Dialekt. Výběr korpusu se provádí z nabídky, která se objeví po kliknutí aktuálně zvolený korpus. Po následné volbě Všechny korpusy vybereme štítek mluvený a v jeho nabídce zvolíme úroveň, která bude primární: buď dialektologickou (**dialekt v1 - dial**), nebo ortografickou (**dialekt v1 - ort**); volba korpusu je obecně popsána v [[manualy: | + | Po přihlášení do KonTextu nejprve vybereme korpus, který představuje požadovanou úroveň přepisu korpusu Dialekt. Výběr korpusu se provádí z nabídky, která se objeví po kliknutí |
K primární úrovni je možné (ale ne nutné) přidat také úroveň sekundární, | K primární úrovni je možné (ale ne nutné) přidat také úroveň sekundární, | ||
Řádek 14: | Řádek 14: | ||
==== 2.1 Nastavení/ | ==== 2.1 Nastavení/ | ||
- | V hlavním manuálu se o korpusových nastaveních a volbách zobrazení dočtete [[manualy: | + | V hlavním manuálu se o korpusových nastaveních a volbách zobrazení dočtete [[manualy: |
- | === Nastavení údajů | + | === Nastavení údajů v kategorii Zobrazení === |
- | Před zadáním dotazu do korpusu je užitečné si nahoře v kategorii **Zobrazení** nastavit určité typy údajů, které se nám ve vyhledaném výsledku zobrazí. Z nabídky si vybereme položku **Korpusová nastavení** a zobrazí se nám karta, kde jsou tři sloupce s údaji.\\ | + | Před zadáním dotazu do korpusu je užitečné si nahoře v kategorii **Zobrazení** nastavit určité typy údajů, které se nám ve vyhledaném výsledku zobrazí. Z nabídky si vybereme položku **Korpusová nastavení** a zobrazí se nám okno, kde lze zvolit jeden ze čtyř štítků.\\ |
- | V prvním sloupci | + | V rámci první možnosti |
- | V prvním sloupci | + | V oddílu Poziční atributy |
- | V druhém | + | V druhém |
- | Ve třetím | + | Ve třetím |
=== Zobrazení údajů o sondě a o mluvčích === | === Zobrazení údajů o sondě a o mluvčích === | ||
- | Pokud si ve vyhledaných konkordancích chceme zobrazit podrobnější údaje o nahrávce a o mluvčím, klikneme na **modrý název sondy**, např. 042-M-STM-1966-SA, | + | Pokud si ve vyhledaných konkordancích chceme zobrazit podrobnější údaje o nahrávce a o mluvčím, klikneme na **modrý název sondy**, např. 042-M-STM-1966-SA, |
=== Třídění výsledku dotazu === | === Třídění výsledku dotazu === | ||
Řádek 36: | Řádek 36: | ||
=== Nastavení klávesnice s nářečními znaky === | === Nastavení klávesnice s nářečními znaky === | ||
- | Speciální znaky jako //ȇ, ȏ// ad. najdete po kliknutí na odkaz **Klávesnice**, | + | Speciální znaky jako //ȇ, ȏ// ad. najdete po kliknutí na odkaz **Klávesnice**, |
- | ==== 2.2 Vytváření dotazů pro vyhledávání | + | ==== 2.2 Vytváření dotazů pro vyhledávání |
- | V hlavním manuálu najdete přehled typů dotazů [[manualy: | + | |
+ | |||
+ | V hlavním manuálu najdete přehled typů dotazů [[manualy: | ||
Jako korpus je v následujících příkladech zvolen **dialekt v1 - dial**, jako základní se tedy zobrazuje rovina dialektologická. | Jako korpus je v následujících příkladech zvolen **dialekt v1 - dial**, jako základní se tedy zobrazuje rovina dialektologická. | ||
Řádek 45: | Řádek 47: | ||
(analogicky ostatní písmena; pozor, u //c// se zobrazí i //ch//) | (analogicky ostatní písmena; pozor, u //c// se zobrazí i //ch//) | ||
- | * V položce Typ dotazu zvolíme: **Slovní tvar** | + | * Výchozí atribut: **word [dial]** |
- | * Dotaz: | + | * Položka |
- | * Třídění podle abecedy: Konkordance, Třídění, word [dial] – setřídí všechny | + | * Dotaz: **b.* ** |
- | * Frekvence: Frekvence, Slovní tvary – jednotlivé tvary seřadí podle frekvence | + | * Třídění podle abecedy: |
- | Dotaz lze omezit např. zadáním **ba.* ** apod., potom opět můžeme roztřídit buď podle abecedy, nebo podle frekvence tvarů. | + | * Frekvence: |
+ | Dotaz lze omezit např. zadáním **ba.* ** apod., potom opět můžeme roztřídit buď podle abecedy, nebo vytvořit seznam | ||
- | Pozn 1: Pokud se vám při zadání některého z dotazů objeví hlášení ve znění: „Byl detekován možný nesoulad mezi zvoleným a faktickým typem dotazu. Chcete pokračovat? | + | Pozn 1: Pokud se vám při zadání některého z dotazů objeví hlášení ve znění: „Byl detekován možný nesoulad mezi zvoleným a faktickým typem dotazu. Chcete pokračovat? |
- | Pozn 2: Chcete-li z vyhledaného výsledku dotazu vybrat např. určitý slovní druh nebo tvar, v menu nahoře zvolíme Filtr, dále vybereme Pozitivní. Objeví se okénko pro zadání dotazu, tj. toho, co chceme z vyhledaného výsledu vybrat. Pokud si např. přejeme všechna substantiva, | + | Pozn 2: Chcete-li z vyhledaného výsledku dotazu vybrat např. určitý slovní druh nebo tvar, v menu nahoře zvolíme Filtr, dále vybereme Pozitivní. Objeví se okénko pro zadání dotazu, tj. toho, co chceme z vyhledaného výsledu vybrat. Pokud si např. přejeme všechna substantiva, |
=== Konkrétní slovní tvar === | === Konkrétní slovní tvar === | ||
- | * Typ dotazu: **Slovní tvar** | + | * Výchozí atribut: **word [dial]** |
* Dotaz: **toš** | * Dotaz: **toš** | ||
Najde všechny tyto slovní tvary. | Najde všechny tyto slovní tvary. | ||
=== Konkrétní slovní lemma === | === Konkrétní slovní lemma === | ||
- | * Typ dotazu: **Lemma** | + | * Výchozí atribut: **lemma** |
* Dotaz: **tož** | * Dotaz: **tož** | ||
- | Najde všechny slovní tvary zařazené pod tímto lemmatem (//toš, tož, tuš, tuž//). | + | Najde všechny slovní tvary zařazené pod tímto lemmatem (//toš, tož, tuš, tuž, to//). |
Doporučujeme dále třídění podle frekvence slovního tvaru, nářeční oblasti apod. | Doporučujeme dále třídění podle frekvence slovního tvaru, nářeční oblasti apod. | ||
=== Slovní varianty === | === Slovní varianty === | ||
- | * Typ dotazu: **CQL** | + | * Typ dotazu: **pokročilý** |
* Dotaz: **'' | * Dotaz: **'' | ||
* Dotaz: **'' | * Dotaz: **'' | ||
Řádek 73: | Řádek 76: | ||
=== Začátek slova === | === Začátek slova === | ||
- | * Typ dotazu: **Slovní tvar** | + | * Výchozí atribut: **word [dial]** |
+ | * Položka **Povolit regulární výrazy** zapnuta | ||
* Dotaz: **bál.* ** | * Dotaz: **bál.* ** | ||
Najde všechna slova, která začínají sledem znaků //bál//. | Najde všechna slova, která začínají sledem znaků //bál//. | ||
=== Část slova === | === Část slova === | ||
- | * Typ dotazu: **Část slova** | + | * Výchozí atribut: **word [dial]** |
- | * Dotaz: **bál** | + | * Položka **Povolit regulární výrazy** zapnuta |
- | Najde všechna slova, která obsahují sled znaků // | + | * Dotaz: **.*bál.* ** |
+ | Najde všechna slova, která obsahují sled znaků //bál//. | ||
=== Infinitiv končící na ť === | === Infinitiv končící na ť === | ||
- | * Typ dotazu: **CQL** | + | * Typ dotazu: **pokročilý** |
* Dotaz: **'' | * Dotaz: **'' | ||
Najde jen infinitivní tvary, ale ve značkování mohou být chyby. | Najde jen infinitivní tvary, ale ve značkování mohou být chyby. | ||
Řádek 89: | Řádek 94: | ||
=== Konkrétní znak, např. všechna slova obsazující tvrdé ł === | === Konkrétní znak, např. všechna slova obsazující tvrdé ł === | ||
- | * Typ dotazu: **Slovní tvar** | + | * Výchozí atribut: **word [dial]** |
+ | * Položka **Povolit regulární výrazy** zapnuta | ||
* Dotaz: **.*ł.* ** | * Dotaz: **.*ł.* ** | ||
=== Všechna slova končící na tvrdé ł === | === Všechna slova končící na tvrdé ł === | ||
- | * Typ dotazu: **Slovní tvar** | + | * Výchozí atribut: **word [dial]** |
+ | * Položka **Povolit regulární výrazy** zapnuta | ||
* Dotaz: **.*ł ** | * Dotaz: **.*ł ** | ||
=== Všechna slova s příponou -hle === | === Všechna slova s příponou -hle === | ||
- | * Typ dotazu: **Slovní tvar** | + | * Výchozí atribut: **word [dial]** |
+ | * Položka **Povolit regulární výrazy** zapnuta | ||
* Dotaz: **.*hle ** | * Dotaz: **.*hle ** | ||
- | Vyhledá ale i slova končící na //-chle//, těch se můžeme zbavit pomocí | + | Vyhledá ale i slova končící na //-chle//, těch se můžeme zbavit pomocí |
=== Slovní spojení === | === Slovní spojení === | ||
- | * Typ dotazu: **Základní** | ||
- | * Dotaz: **černý kuchyně ** | ||
- | * Dotaz: **čočkový polévka ** | ||
- | Pozn: Při zadávání dotazu musíme dávat | + | Zkusme si nejprve v korpusu **dialekt v1 - ort** zadat sousloví //sousední vesnice//. S výchozím atributem **word[ort]** dostaneme jeden výsledek, zajímají-li nás však výskyty daného sousloví ve všech pádových formách a nehledě na číslo, musíme změnit atribut na **lemma**. |
===== 3 Tipy pro práci se subkorpusy ===== | ===== 3 Tipy pro práci se subkorpusy ===== | ||
- | Pro vyhledávání si můžeme zúžit výběr nahrávek podle předem zvolených kritérií, a to buď pomocí funkce **Omezit hledání** nebo **vytvořením subkorpusu**. (V hlavním manuálu se o první možnosti dočtete v oddílu [[manualy: | + | Pro vyhledávání si můžeme zúžit výběr nahrávek podle předem zvolených kritérií, a to buď pomocí funkce **Omezit hledání** nebo **vytvořením subkorpusu**. (V hlavním manuálu se o první možnosti dočtete v oddílu [[manualy: |
Funkci **Omezit hledání** nalezneme na hlavní vyhledávací stránce dole. Pokud na ni klikneme, zobrazí se nám řada skupin parametrů, podle kterých lze vybírat typy nahrávek nebo mluvčích, v rámci kterých se bude vyhledávat. | Funkci **Omezit hledání** nalezneme na hlavní vyhledávací stránce dole. Pokud na ni klikneme, zobrazí se nám řada skupin parametrů, podle kterých lze vybírat typy nahrávek nebo mluvčích, v rámci kterých se bude vyhledávat. | ||
Řádek 117: | Řádek 122: | ||
=== Nastavení subkorpusu === | === Nastavení subkorpusu === | ||
- | Pro přihlášeného uživatele zůstane subkorpus trvale uložen. | + | Nahoře v nabídce klikneme na položku **Korpusy** a potom na **Vytvořit nový subkorpus**. Objeví se nám pestrá škála parametrů, které se vyskytují i u funkce Omezit hledání. Pro přihlášeného uživatele zůstane subkorpus trvale uložen. |
== Vytvoření subkorpusu z nahrávek publikovaných v Českém jazykovém atlasu == | == Vytvoření subkorpusu z nahrávek publikovaných v Českém jazykovém atlasu == | ||
Do prázdného okénka **Název nového subkorpusu** napíšeme název subkorpusu, jak si ho sami zvolíme, např. v tomto případě CJA. U položky **doc.zdroj** zaškrtneme možnost Ústav pro jazyk český AV ČR – ČJA a už jen zcela dole vlevo klikneme na příkaz **Vytvořit subkorpus**. Objeví se seznam subkorpusů a tam si můžeme subkorpus kliknutím zvolit.\\ | Do prázdného okénka **Název nového subkorpusu** napíšeme název subkorpusu, jak si ho sami zvolíme, např. v tomto případě CJA. U položky **doc.zdroj** zaškrtneme možnost Ústav pro jazyk český AV ČR – ČJA a už jen zcela dole vlevo klikneme na příkaz **Vytvořit subkorpus**. Objeví se seznam subkorpusů a tam si můžeme subkorpus kliknutím zvolit.\\ | ||
- | Náš vytvořený subkorpus najdeme tak, že v menu nahoře zvolíme **Korpusy** a dále **Mé subkorpusy** (subkorpus tam můžeme po zaškrtnutí okénka také smazat). Subkorpus lze vybrat z nabídky při zadávání dotazu – v menu nahoře zvolíme **Dotaz** a **Zadat nový dotaz** – a na stránce pro zadávání dotazu je vedle položky **Korpus: dialekt v1 – dial** také nabízející se položka **--celý korpus--**. Po kliknutí na ni se zobrazí i nabídka našich vytvořených subkorpusů. Potom už jen standardním způsobem zadáváme dotaz, kde bude vyhledávání omezeno jen na zvolený subkorpus. | + | Náš vytvořený subkorpus najdeme tak, že v menu nahoře zvolíme **Korpusy** a dále **Mé subkorpusy** (subkorpus tam můžeme po zaškrtnutí okénka také smazat). Subkorpus lze vybrat z nabídky při zadávání dotazu – v menu nahoře zvolíme **Dotaz** a **Zadat nový dotaz** – a na stránce pro zadávání dotazu je vedle položky **Korpus: dialekt v1 – dial** také nabízející se položka **--celý korpus--**. Po kliknutí na ni se zobrazí i nabídka našich vytvořených subkorpusů, z nichž můžeme kterýkoli zvolit. Potom už jen standardním způsobem zadáváme dotaz, kde bude vyhledávání omezeno jen na zvolený subkorpus. |
== Vytvoření subkorpusu ze starší vrstvy nahrávek == | == Vytvoření subkorpusu ze starší vrstvy nahrávek == |