Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzePoslední revizeObě strany příští revize | ||
cnk:dialekt:prace [2021/01/12 10:47] – [1 Práce s korpusem Dialekt] martinawaclawicova | cnk:dialekt:prace [2021/01/14 09:41] – [Související odkazy] martinawaclawicova | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
====== 1 Práce s korpusem Dialekt ====== | ====== 1 Práce s korpusem Dialekt ====== | ||
- | Následující text přináší tipy pro základní práci s korpusem [[cnk: | + | Následující text přináší tipy pro základní práci s korpusem [[cnk: |
- | Korpus Dialekt | + | Korpus Dialekt |
=== Volba korpusu === | === Volba korpusu === | ||
Řádek 14: | Řádek 14: | ||
==== 2.1 Nastavení/ | ==== 2.1 Nastavení/ | ||
- | V hlavním manuálu se o korpusových nastaveních a volbách zobrazení dočtete [[manualy: | + | V hlavním manuálu se o korpusových nastaveních a volbách zobrazení dočtete [[manualy: |
- | === Nastavení údajů | + | === Nastavení údajů v kategorii Zobrazení === |
- | Před zadáním dotazu do korpusu je užitečné si nahoře v kategorii **Zobrazení** nastavit určité typy údajů, které se nám ve vyhledaném výsledku zobrazí. Z nabídky si vybereme položku **Korpusová nastavení** a zobrazí se nám karta, kde jsou tři sloupce s údaji.\\ | + | Před zadáním dotazu do korpusu je užitečné si nahoře v kategorii **Zobrazení** nastavit určité typy údajů, které se nám ve vyhledaném výsledku zobrazí. Z nabídky si vybereme položku **Korpusová nastavení** a zobrazí se nám okno, kde lze zvolit jeden ze čtyř štítků.\\ |
- | V prvním sloupci | + | V rámci první možnosti |
- | V prvním sloupci | + | V oddílu Poziční atributy |
- | V druhém | + | V druhém |
- | Ve třetím | + | Ve třetím |
=== Zobrazení údajů o sondě a o mluvčích === | === Zobrazení údajů o sondě a o mluvčích === | ||
- | Pokud si ve vyhledaných konkordancích chceme zobrazit podrobnější údaje o nahrávce a o mluvčím, klikneme na **modrý název sondy**, např. 042-M-STM-1966-SA, | + | Pokud si ve vyhledaných konkordancích chceme zobrazit podrobnější údaje o nahrávce a o mluvčím, klikneme na **modrý název sondy**, např. 042-M-STM-1966-SA, |
=== Třídění výsledku dotazu === | === Třídění výsledku dotazu === | ||
Řádek 48: | Řádek 48: | ||
* Výchozí atribut: **word [dial]** | * Výchozí atribut: **word [dial]** | ||
- | * Dotaz: | + | * Položka |
- | * Třídění podle abecedy: **Konkordance -- Třídění -- word [dial]** – setřídí všechny | + | * Dotaz: **b.* ** |
- | * Frekvence: **Frekvence -- Slovní tvary** – jednotlivé tvary seřadí podle frekvence | + | * Třídění podle abecedy: **Konkordance -- Třídění -- word [dial]** – setřídí všechny |
- | Dotaz lze omezit např. zadáním **ba.* ** apod., potom opět můžeme roztřídit buď podle abecedy, nebo podle frekvence tvarů. | + | * Frekvence: **Frekvence -- Slovní tvary** – zobrazí seznam tvarů |
+ | Dotaz lze omezit např. zadáním **ba.* ** apod., potom opět můžeme roztřídit buď podle abecedy, nebo vytvořit seznam | ||
Pozn 1: Pokud se vám při zadání některého z dotazů objeví hlášení ve znění: „Byl detekován možný nesoulad mezi zvoleným a faktickým typem dotazu. Chcete pokračovat? | Pozn 1: Pokud se vám při zadání některého z dotazů objeví hlášení ve znění: „Byl detekován možný nesoulad mezi zvoleným a faktickým typem dotazu. Chcete pokračovat? | ||
- | Pozn 2: Chcete-li z vyhledaného výsledku dotazu vybrat např. určitý slovní druh nebo tvar, v menu nahoře zvolíme Filtr, dále vybereme Pozitivní. Objeví se okénko pro zadání dotazu, tj. toho, co chceme z vyhledaného výsledu vybrat. Pokud si např. přejeme všechna substantiva, | + | Pozn 2: Chcete-li z vyhledaného výsledku dotazu vybrat např. určitý slovní druh nebo tvar, v menu nahoře zvolíme Filtr, dále vybereme Pozitivní. Objeví se okénko pro zadání dotazu, tj. toho, co chceme z vyhledaného výsledu vybrat. Pokud si např. přejeme všechna substantiva, |
=== Konkrétní slovní tvar === | === Konkrétní slovní tvar === | ||
Řádek 63: | Řádek 64: | ||
=== Konkrétní slovní lemma === | === Konkrétní slovní lemma === | ||
- | * Výchozí atribut: **Lemma** | + | * Výchozí atribut: **lemma** |
* Dotaz: **tož** | * Dotaz: **tož** | ||
Najde všechny slovní tvary zařazené pod tímto lemmatem (//toš, tož, tuš, tuž, to//). | Najde všechny slovní tvary zařazené pod tímto lemmatem (//toš, tož, tuš, tuž, to//). | ||
Řádek 76: | Řádek 77: | ||
=== Začátek slova === | === Začátek slova === | ||
* Výchozí atribut: **word [dial]** | * Výchozí atribut: **word [dial]** | ||
- | * Dotaz (se zapnutím regulárních výrazů): **bál.* ** | + | |
+ | | ||
Najde všechna slova, která začínají sledem znaků //bál//. | Najde všechna slova, která začínají sledem znaků //bál//. | ||
=== Část slova === | === Část slova === | ||
* Výchozí atribut: **word [dial]** | * Výchozí atribut: **word [dial]** | ||
- | * Dotaz (se zapnutím regulárních výrazů): **.*bál.* ** | + | |
+ | | ||
Najde všechna slova, která obsahují sled znaků //bál//. | Najde všechna slova, která obsahují sled znaků //bál//. | ||
Řádek 92: | Řádek 95: | ||
=== Konkrétní znak, např. všechna slova obsazující tvrdé ł === | === Konkrétní znak, např. všechna slova obsazující tvrdé ł === | ||
* Výchozí atribut: **word [dial]** | * Výchozí atribut: **word [dial]** | ||
- | * Dotaz (se zapnutím regulárních výrazů): **.*ł.* ** | + | |
+ | | ||
=== Všechna slova končící na tvrdé ł === | === Všechna slova končící na tvrdé ł === | ||
* Výchozí atribut: **word [dial]** | * Výchozí atribut: **word [dial]** | ||
- | * Dotaz (se zapnutím regulárních výrazů): **.*ł ** | + | |
+ | | ||
=== Všechna slova s příponou -hle === | === Všechna slova s příponou -hle === | ||
* Výchozí atribut: **word [dial]** | * Výchozí atribut: **word [dial]** | ||
- | * Dotaz (se zapnutím regulárních výrazů): **.*hle ** | + | |
+ | | ||
Vyhledá ale i slova končící na //-chle//, těch se můžeme zbavit pomocí negativního filtru. V menu nahoře zvolíme Filtr -- Negativní a do dotazového řádku napíšeme '' | Vyhledá ale i slova končící na //-chle//, těch se můžeme zbavit pomocí negativního filtru. V menu nahoře zvolíme Filtr -- Negativní a do dotazového řádku napíšeme '' | ||
=== Slovní spojení === | === Slovní spojení === | ||
- | * Výchozí atribut: **lemma** | ||
- | * Dotaz: **černý kuchyně ** | ||
- | * Dotaz: **čočkový polévka ** FIXME | ||
- | Pozn: Při zadávání dotazu musíme dávat | + | Zkusme si nejprve v korpusu **dialekt v1 - ort** zadat sousloví //sousední vesnice//. S výchozím atributem **word[ort]** dostaneme jeden výsledek, zajímají-li nás však výskyty daného sousloví ve všech pádových formách a nehledě na číslo, musíme změnit atribut na **lemma**. |
===== 3 Tipy pro práci se subkorpusy ===== | ===== 3 Tipy pro práci se subkorpusy ===== | ||
- | Pro vyhledávání si můžeme zúžit výběr nahrávek podle předem zvolených kritérií, a to buď pomocí funkce **Omezit hledání** nebo **vytvořením subkorpusu**. (V hlavním manuálu se o první možnosti dočtete v oddílu [[manualy: | + | Pro vyhledávání si můžeme zúžit výběr nahrávek podle předem zvolených kritérií, a to buď pomocí funkce **Omezit hledání** nebo **vytvořením subkorpusu**. (V hlavním manuálu se o první možnosti dočtete v oddílu [[manualy: |
Funkci **Omezit hledání** nalezneme na hlavní vyhledávací stránce dole. Pokud na ni klikneme, zobrazí se nám řada skupin parametrů, podle kterých lze vybírat typy nahrávek nebo mluvčích, v rámci kterých se bude vyhledávat. | Funkci **Omezit hledání** nalezneme na hlavní vyhledávací stránce dole. Pokud na ni klikneme, zobrazí se nám řada skupin parametrů, podle kterých lze vybírat typy nahrávek nebo mluvčích, v rámci kterých se bude vyhledávat. | ||
Řádek 119: | Řádek 122: | ||
=== Nastavení subkorpusu === | === Nastavení subkorpusu === | ||
- | Pro přihlášeného uživatele zůstane subkorpus trvale uložen. | + | Nahoře v nabídce klikneme na položku **Korpusy** a potom na **Vytvořit nový subkorpus**. Objeví se nám pestrá škála parametrů, které se vyskytují i u funkce Omezit hledání. Pro přihlášeného uživatele zůstane subkorpus trvale uložen. |
== Vytvoření subkorpusu z nahrávek publikovaných v Českém jazykovém atlasu == | == Vytvoření subkorpusu z nahrávek publikovaných v Českém jazykovém atlasu == | ||
Do prázdného okénka **Název nového subkorpusu** napíšeme název subkorpusu, jak si ho sami zvolíme, např. v tomto případě CJA. U položky **doc.zdroj** zaškrtneme možnost Ústav pro jazyk český AV ČR – ČJA a už jen zcela dole vlevo klikneme na příkaz **Vytvořit subkorpus**. Objeví se seznam subkorpusů a tam si můžeme subkorpus kliknutím zvolit.\\ | Do prázdného okénka **Název nového subkorpusu** napíšeme název subkorpusu, jak si ho sami zvolíme, např. v tomto případě CJA. U položky **doc.zdroj** zaškrtneme možnost Ústav pro jazyk český AV ČR – ČJA a už jen zcela dole vlevo klikneme na příkaz **Vytvořit subkorpus**. Objeví se seznam subkorpusů a tam si můžeme subkorpus kliknutím zvolit.\\ | ||
- | Náš vytvořený subkorpus najdeme tak, že v menu nahoře zvolíme **Korpusy** a dále **Mé subkorpusy** (subkorpus tam můžeme po zaškrtnutí okénka také smazat). Subkorpus lze vybrat z nabídky při zadávání dotazu – v menu nahoře zvolíme **Dotaz** a **Zadat nový dotaz** – a na stránce pro zadávání dotazu je vedle položky **Korpus: dialekt v1 – dial** také nabízející se položka **--celý korpus--**. Po kliknutí na ni se zobrazí i nabídka našich vytvořených subkorpusů. Potom už jen standardním způsobem zadáváme dotaz, kde bude vyhledávání omezeno jen na zvolený subkorpus. | + | Náš vytvořený subkorpus najdeme tak, že v menu nahoře zvolíme **Korpusy** a dále **Mé subkorpusy** (subkorpus tam můžeme po zaškrtnutí okénka také smazat). Subkorpus lze vybrat z nabídky při zadávání dotazu – v menu nahoře zvolíme **Dotaz** a **Zadat nový dotaz** – a na stránce pro zadávání dotazu je vedle položky **Korpus: dialekt v1 – dial** také nabízející se položka **--celý korpus--**. Po kliknutí na ni se zobrazí i nabídka našich vytvořených subkorpusů, z nichž můžeme kterýkoli zvolit. Potom už jen standardním způsobem zadáváme dotaz, kde bude vyhledávání omezeno jen na zvolený subkorpus. |
== Vytvoření subkorpusu ze starší vrstvy nahrávek == | == Vytvoření subkorpusu ze starší vrstvy nahrávek == | ||
Řádek 136: | Řádek 139: | ||
<WRAP round box 72%> | <WRAP round box 72%> | ||
- | [[cnk: | + | [[cnk: |
</ | </ |