Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze |
cnk:schola_vyhledavani_a_subkorpusy [2017/04/07 10:40] – [Přístup do korpusu přes rozhraní KonText] michalskrabal | cnk:schola_vyhledavani_a_subkorpusy [2021/01/07 12:52] (aktuální) – michalskrabal |
---|
===== Vytváření subkorpusů (pro přihlášené uživatele) ===== | ===== Vytváření subkorpusů (pro přihlášené uživatele) ===== |
| |
Jazykový materiál v korpusu SCHOLA2010 lze omezit podle toho, jaký cíl má naše vyhledávání. Uživatel si může podle různých kritérií (i podle jejich kombinací) vytvořit subkorpus, se kterým bude dále pracovat (subkorpus může zůstat uživateli po přihlášení nastaven v seznamu ostatních korpusů nebo subkorpusů). Podrobnosti o subkorpusech a jejich tvorbě lze nalézt v [[manualy:kontext:subkorpus|Manuálu]] k rozhraní KonText nebo v [[kurz:subkorpusy|7.lekci]] kurzu práce s ČNK. | Jazykový materiál v korpusu SCHOLA2010 lze omezit podle toho, jaký cíl má naše vyhledávání. Uživatel si může podle různých kritérií (i podle jejich kombinací) vytvořit subkorpus, se kterým bude dále pracovat (subkorpus může zůstat uživateli po přihlášení nastaven v seznamu ostatních korpusů nebo subkorpusů). Podrobnosti o subkorpusech a jejich tvorbě lze nalézt v [[manualy:kontext:subkorpus|manuálu]] k rozhraní KonText nebo v [[kurz:subkorpusy|7. lekci]] kurzu práce s ČNK. |
| |
==== Přístup do korpusu přes rozhraní KonText ==== | ==== Přístup do korpusu přes rozhraní KonText ==== |
| |
Chceme-li vyhledávat v korpusu SCHOLA2010 pomocí [[https://www.korpus.cz/kontext|KonTextu]], zvolíme v synchronních mluvených korpusech Specializované a korpus SCHOLA2010. Dole klikneme na položku **Vybrat texty** a objeví se nám zaškrtávací pole s tabulkami (nabídka je vytvořena podle [[cnk:sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010|Sociolingvistických a didaktických značek v korpusu SCHOLA2010]]). Jejich výběrem si můžeme dotaz omezit a vyhledat potřebné údaje. Jestliže si chceme vytvořit svůj subkorpus trvalého charakteru, postupujeme následujícím způsobem: | Chceme-li vyhledávat v korpusu SCHOLA2010 pomocí [[https://www.korpus.cz/kontext|KonTextu]], zvolíme v synchronních mluvených korpusech Specializované a korpus SCHOLA2010. Dole klikneme na položku **Omezit hledání** a objeví se nám zaškrtávací pole s tabulkami (nabídka je vytvořena podle [[cnk:sociolingvisticke_znacky_a_charakteristiky_v_korpusu_schola2010|Sociolingvistických a didaktických značek v korpusu SCHOLA2010]]). Jejich výběrem si můžeme dotaz omezit a vyhledat potřebné údaje. Jestliže si chceme vytvořit svůj subkorpus trvalého charakteru, postupujeme následujícím způsobem: |
| |
Př.: **subkorpus -- žáci** (mluvčí – všichni žáci z korpusu SCHOLA2010) | Př.: **subkorpus -- žáci** (mluvčí – všichni žáci z korpusu SCHOLA2010) |
| |
Do okénka **Dotaz** zadáme příslušný dotaz, kterým chceme v korpusu vyhledat potřebné údaje, a odentrujeme. Tak získáme výsledek dotazu z celého korpusu. Subkorpus si vytvoříme pomocí volby **Subkorpusy → Vytvořit nový subkorpus** v nabídce nahoře, v nové kartě v příslušném okénku vyplníme jméno subkorpusu, např. //žáci//. | Do dotazovacího řádku zadáme příslušný dotaz, kterým chceme v korpusu vyhledat potřebné údaje, a odentrujeme. Tak získáme výsledek dotazu z celého korpusu. Subkorpus si vytvoříme pomocí volby **Subkorpusy → Vytvořit nový subkorpus** v nabídce nahoře, v nové kartě v příslušném okénku vyplníme jméno subkorpusu, např. //žáci//. |
| |
V nabídnuté tabulce vybereme sociolingvistickou značku //sp.osoba// a zaškrtneme **žák**, potom dole pod tabulkami zvolíme **Vytvořit subkorpus**. Objeví se nám karta s přehledem vytvořených subkorpusů. Zpět k dotazu se vrátíme tak, že v nabídce nahoře klikneme na **Dotaz → Nový dotaz**. Vpravo od volby Korpus je nabídka //Celý korpus// spolu s názvy vytvořených subkorpusů: zvolíme subkorpus //žáci// a zadáme do okénka **Dotaz → Nový dotaz**, kterým chceme vyhledat potřebné údaje v příslušném subkorpusu. | V nabídnuté tabulce vybereme sociolingvistickou značku //sp.osoba// a zaškrtneme **žák**, potom dole pod tabulkami zvolíme **Vytvořit subkorpus**. Objeví se nám karta s přehledem vytvořených subkorpusů. Zpět k dotazu se vrátíme tak, že v nabídce nahoře klikneme na **Dotaz → Nový dotaz**. Vpravo od volby Korpus je nabídka //Celý korpus// spolu s názvy vytvořených subkorpusů: zvolíme subkorpus //žáci// a zadáme do dotazovacího řádku příslušný dotaz, kterým chceme vyhledat potřebné údaje v příslušném subkorpusu. |
| |
Př.: **subkorpus -- Čechy** (všechny sondy z regionu Čechy) | Př.: **subkorpus -- Čechy** (všechny sondy z regionu Čechy) |
| |
Postupujeme stejným způsobem jako v předchozím případě. V nabídce sociolingvistických údajů zaškrtneme u značky doc.region položku **Čechy** a nezapomeneme do kolonky **Jméno nového subkorpusu** napsat název nového subkorpusu – např. //Čechy//, dole potvrdíme kliknutím na **Vytvořit subkorpus**. | Postupujeme stejným způsobem jako v předchozím případě. V nabídce sociolingvistických údajů zaškrtneme u značky doc.region položku **Čechy** a nezapomeneme do kolonky **Název nového subkorpusu** napsat jeho jméno – např. //Čechy//, dole potvrdíme kliknutím na **Vytvořit subkorpus**. |
| |
Na základě následujícího postupu si můžeme vytvořit subkorpusy na úrovni sondy – např. podle roků pořízení sondy, jednotlivých regionů (Čechy, nebo Morava), nářečních oblastí (středočeská, jihozápodočeská, východomoravská atd.), podle místa pořízení sondy (Praha atd.), velikosti sídla (nad 100 tis, méně než 5 tis. atd.) – dále na úrovni školy (ZŠ, G, SOŠ atd.), třídy nebo ročníku (1., 2, atd.), vyučovacího předmětu (Čjl, Ma, Fy atd.), vyučovací hodiny (1. hodina, 2. hodina atd.) a mluvčího (muž, žena; učitel, žák; věk mluvčího atd.). | Na základě následujícího postupu si můžeme vytvořit subkorpusy na úrovni sondy – např. podle roků pořízení sondy, jednotlivých regionů (Čechy, nebo Morava), nářečních oblastí (středočeská, jihozápodočeská, východomoravská atd.), podle místa pořízení sondy (Praha atd.), velikosti sídla (nad 100 tis, méně než 5 tis. atd.) – dále na úrovni školy (ZŠ, G, SOŠ atd.), třídy nebo ročníku (1., 2, atd.), vyučovacího předmětu (Čjl, Ma, Fy atd.), vyučovací hodiny (1. hodina, 2. hodina atd.) a mluvčího (muž, žena; učitel, žák; věk mluvčího atd.). |
| |
**Kombinace více podmínek** na stejné úrovni:\\ | **Kombinace více podmínek** na stejné úrovni:\\ |
''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki>| osoba=<nowiki>"</nowiki>cizí dospělá osoba<nowiki>"</nowiki>/>''\\ (zobrazí vše, co řekli učitelé a cizí dospělé osoby)\\ | ''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki> | osoba=<nowiki>"</nowiki>cizí dospělá osoba<nowiki>"</nowiki>/>''\\ (zobrazí vše, co řekli učitelé a cizí dospělé osoby)\\ |
| |
===Dotazy obsahující více podmínek z různých úrovní=== | ===Dotazy obsahující více podmínek z různých úrovní=== |
| |
**a) na úrovni jednoho typu anotací**\\ | **a) na úrovni jednoho typu anotace**\\ |
| |
''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki> & pohlavi=<nowiki>"</nowiki>Z<nowiki>"</nowiki>/>'' (zobrazí vše, co řekly učitelky)\\ | ''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki> & pohlavi=<nowiki>"</nowiki>Z<nowiki>"</nowiki>/>'' (zobrazí vše, co řekly učitelky)\\ |
| |
''[word=<nowiki>"</nowiki>vole<nowiki>"</nowiki>] within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki>& pohlavi=<nowiki>"</nowiki>M<nowiki>"</nowiki>/>'' (zobrazí všechna //vole//, která řekli učitelé – muži)\\ | ''[word=<nowiki>"</nowiki>vole<nowiki>"</nowiki>] within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki> & pohlavi=<nowiki>"</nowiki>M<nowiki>"</nowiki>/>'' (zobrazí všechna //vole//, která řekli učitelé – muži)\\ |
| |
**b) na úrovni různých typů anotací**\\ | **b) na úrovni různých typů anotace**\\ |
| |
''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <pr predmet=<nowiki>"</nowiki>Čjl<nowiki>"</nowiki>/> within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki>/>'' (zobrazí vše, co řekli učitelé a učitelky češtiny)\\ | ''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <pr predmet=<nowiki>"</nowiki>Čjl<nowiki>"</nowiki>/> within <sp osoba=<nowiki>"</nowiki>učitel<nowiki>"</nowiki>/>'' (zobrazí vše, co řekli učitelé a učitelky češtiny)\\ |
| |
=== Dotazy pomocí podmínek a filtrů=== | === Dotazy pomocí podmínek a filtrů=== |
Př. **chceme najít vše, co řekly žákyně 1. třídy**\\ | Př.: **chceme najít vše, co řekly žákyně 1. třídy**\\ |
''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <sp pohlavi=<nowiki>"</nowiki>Z<nowiki>"</nowiki>/>''\\ | ''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <sp pohlavi=<nowiki>"</nowiki>Z<nowiki>"</nowiki>/>''\\ |
**P-filtr**\\ | **P-filtr**\\ |
''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <tr trida=<nowiki>"</nowiki>1.<nowiki>"</nowiki>/''> | ''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <tr trida=<nowiki>"</nowiki>1.<nowiki>"</nowiki>/''> |
| |
Pozn.: Nastavit P filtr tak, aby byl rozsah **od 0 do 0**, potom zaškrtnout //**"včetně KWIC"**//.\\ | Pozn.: Nastavit P-filtr tak, aby byl rozsah **od 0 do 0**, potom zaškrtnout volbu **včetně KWIC**.\\ |
| |
Př. **chceme najít všechna //vlastně// řečená učitelkami češtiny na gymnáziích**\\ | Př.: **chceme najít všechna //vlastně// řečená učitelkami češtiny na gymnáziích**\\ |
''[word=<nowiki>"</nowiki>vlastně<nowiki>"</nowiki>] within <sp pohlavi=<nowiki>"</nowiki>Z<nowiki>"</nowiki>/>''\\ | ''[word=<nowiki>"</nowiki>vlastně<nowiki>"</nowiki>] within <sp pohlavi=<nowiki>"</nowiki>Z<nowiki>"</nowiki>/>''\\ |
**P-filtr**\\ | **P-filtr**\\ |
=== Zjednodušování podmínek v dotazech === | === Zjednodušování podmínek v dotazech === |
| |
V zadávaných dotazech můžeme složitější podmínky zjednodušit, příp. upravit, pomocí [[pojmy:regularni_vyrazy|regulárních výrazů]]. | V zadávaných dotazech můžeme složitější podmínky zjednodušit (případně upravit) pomocí [[pojmy:regularni_vyrazy|regulárních výrazů]]. |
| |
**Dotaz – zadání části podmínky**\\ | **Dotaz – zadání části podmínky**\\ |
''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <pr cjl=<nowiki>"</nowiki>převážně sloh.*<nowiki>"</nowiki>/>''\\ | ''[word=<nowiki>"</nowiki>.*<nowiki>"</nowiki>] within <pr cjl=<nowiki>"</nowiki>převážně sloh.*<nowiki>"</nowiki>/>''\\ |
| |
Pozn.: Výsledek zadaných dotazů si můžeme kontrolovat také pomocí **Frekvence > Vlastní > Frekvenční distribuce podle metainformací.** | Pozn.: Výsledky zadaných dotazů si můžeme kontrolovat také pomocí volby **Frekvence → Vlastní → Podle typů textů**. |
| |
-- //Hana Goláňová// | -- //Hana Goláňová// |