Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verzeNásledující verzeObě strany příští revize |
manualy:kontext:subkorpus [2015/10/01 14:03] – [Subkorpusy a paralelní korpusy na seznamu oblíbených korpusů] luciechlumska | manualy:kontext:subkorpus [2017/08/08 16:53] – jankocek |
---|
====== Menu: Korpus ====== | ====== Menu: Korpusy ====== |
| |
====== Dostupné korpusy ====== | ====== Dostupné korpusy ====== |
| |
Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu **Korpusy → Dostupné korpusy**. Tato stránka je určena pro zobrazení všech korpusů zveřejněných v rámci ČNK, tedy i těch hostovaných. Vzhledem k velkému počtu korpusů (v řádu desítek) se při prvním přihlášení uživateli zobrazí předfiltrovaný seznam korpusů se štítkem "čeština" (zahrnující jak korpusy řady SYN, tak ORAL a mnohé specializované a hostované korpusy). Kompletní **seznam všech korpusů** v abecedním pořadí se zobrazí po kliknutí na "Zrušit výběr". Vedle korpusů, na něž se vztahuje nějaké publikační omezení, je ikona v podobě zámečku. Pokud má uživatel zájem o přístup k takovému korpusu, po kliknutí na ikonu o něj může zažádat a korpus mu bude, umožňují-li to licenční ujednání, zpřístupněn. | Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu **Korpusy → Dostupné korpusy**. Vzhledem k velkému počtu korpusů a jejich verzí se **při prvním přihlášení** uživateli zobrazí předfiltrovaný seznam korpusů se štítkem "čeština" (zahrnující jak korpusy řady SYN, tak i ORAL a mnohé specializované a hostované korpusy). Kompletní **seznam všech korpusů v abecedním pořadí** se zobrazí po kliknutí na štítek „Zrušit výběr“ úplně vlevo. Při dalším přihlášení si rozhraní KonText bude pamatovat poslední nastavení uživatele a zobrazí seznam v té podobě, v jaké si jej uživatel při poslední návštěvě sám navolil. |
| |
Podobně jako při volbě korpusu (tady prosím místo volbě korpusu link na tu druhou stránku) před vyhledáváním lze seznam korpusů libovolně filtrovat podle různých kritérií. Jednou z možností je využití tzv. štítků charakterizujících každý korpus, dále je možné filtrovat také podle jména korpusu (i části jména) nebo jeho velikosti (záložka //pokročilé//). Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi [[manualy:kontext:novy_dotaz#volba_korpusu|oblíbené]], jejím zhasnutím korpus z oblíbených naopak vyřadíme. | Vedle korpusů, na něž se vztahuje nějaké, zpravidla licenční omezení, je **ikona v podobě zámečku**. Pokud má uživatel zájem o přístup k takovému korpusu, po kliknutí na ikonu o něj může zažádat a korpus mu bude podle možností zpřístupněn. |
| |
| Podobně jako při [[manualy:kontext:novy_dotaz#volba_korpusu|volbě korpusu]] před vyhledáváním lze také seznam korpusů libovolně filtrovat podle různých kritérií. Jednou z možností je využití tzv. štítků charakterizujících každý korpus, dále je možné filtrovat podle jména korpusu nebo jeho části, případně podle velikosti (záložka //Pokročilé//). Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi [[manualy:kontext:novy_dotaz#volba_korpusu|oblíbené]], jejím zhasnutím korpus z oblíbených naopak vyřadíme. |
| |
| === Subkorpusy a paralelní korpusy na seznamu oblíbených === |
| |
| Za oblíbenou položku je možné označit nejenom celý samostatný korpus, ale také korpus včetně subkorpusu nebo zarovnané dvojice či trojice korpusů v rámci paralelního korpusu [[cnk:intercorp|InterCorp]], což práci s ním výrazně urychluje. Vzhledem k tomu, že se všechny kombinace subkorpusů a/nebo zarovnaných korpusů v seznamu dostupných korpusů pochopitelně objevit nemůžou, je nutné je přidat mezi oblíbené tehdy, když jsou zvoleny jako aktuální. Obecně platí, že po kliknutí na hvězdičku vedle názvu korpusu (subkorpusu) v okamžiku, kdy je daný korpus (subkorpus) zvolen jako aktuální pro vyhledávání, se do oblíbených automaticky uloží celá tato kombinace (případně včetně zarovnaných korpusů). |
| |
| |
| |
| |
====== Práce se subkorpusy ====== | ====== Práce se subkorpusy ====== |
[{{ :manualy:kontext:subkorpus_vytvorit.png?direct&300|Vytváření nového subkorpusu }}] | [{{ :manualy:kontext:subkorpus_vytvorit.png?direct&300|Vytváření nového subkorpusu }}] |
| |
V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Specifikovat dotaz podle metainformací]] při zadávání nového dotazu). | |
| V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:kontext:novy_dotaz#vybrat_texty|Vybrat texty]] při zadávání nového dotazu). |
| |
Zvolíme-li v menu **Subkorpus → Vytvořit nový**, zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat: | Zvolíme-li v menu **Subkorpus → Vytvořit nový**, zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat: |
| |
- výchozí korpus, z něhož budeme vybírat texty | - výchozí korpus, z něhož budeme vybírat texty, |
- jméno subkorpusu, jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit | - jméno subkorpusu, jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit, |
- podmínku, na základě které vybereme texty do subkorpusu | - podmínku, na základě které vybereme texty do subkorpusu. |
| |
Podmínku je možné specifikovat buď [[pojmy:dotazovaci_jazyk|CQL]] dotazem pomocí příkazu [[kurz:subkorpusy|within]], nebo výběrem hodnot [[pojmy:atributy_strukturni|strukturních atributů]] z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů v dané kategorii). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. | Podmínku je možné specifikovat buď [[pojmy:dotazovaci_jazyk|CQL]] dotazem pomocí příkazu [[kurz:subkorpusy|within]], nebo výběrem hodnot [[pojmy:atributy_strukturni|strukturních atributů]] z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů v dané kategorii). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. |
V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v [[cnk:syn2010|SYN2010]] jsou to [[pojmy:txtype_group|txtype_group]], [[pojmy:txtype|txtype]], [[pojmy:genre|genre]], [[pojmy:medium|med]], [[pojmy:srclang|srclang]]). Použité zkratky je možné dohledat v příslušné sekci [[seznamy:index|seznamů]]. | V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v [[cnk:syn2010|SYN2010]] jsou to [[pojmy:txtype_group|txtype_group]], [[pojmy:txtype|txtype]], [[pojmy:genre|genre]], [[pojmy:medium|med]], [[pojmy:srclang|srclang]]). Použité zkratky je možné dohledat v příslušné sekci [[seznamy:index|seznamů]]. |
| |
Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Dotaz]]) V posledním sloupci se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]] (v závislosti na zvoleném korpusu), které odpovídají specifikované podmínce. Pokud by takový seznam byl příliš dlouhý, je v daném sloupci uveden pouze počet položek. V případě, že si z nabídky zvolíme nějaké kategorie, můžeme si zobrazit soupis textů, které takovéto podmínce odpovídají, pomocí tlačítka **zúžit výběr** (vlevo dole). Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít. | Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#vybrat_texty|Dotaz]]). V posledním sloupci se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]] (v závislosti na zvoleném korpusu), které odpovídají specifikované podmínce. Pokud by takový seznam byl příliš dlouhý, je v daném sloupci uveden pouze počet položek. V případě, že si z nabídky zvolíme nějaké kategorie, můžeme si zobrazit soupis textů, které takovéto podmínce odpovídají, pomocí tlačítka **Zúžit výběr**. Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít. |
| |
| [{{ :manualy:kontext:subkorpus_50-50.png?direct&300|Subkorpus vytvořený z podle vlastních kritérií}}] |
| |
| Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využít, zaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na Zúžit výběr. Tím se zpřístupní funkce Vlastní poměry typů textů. Pokud tedy například chceme korpus publicistiky, který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry, NTW: celostátní tisk a REG: regionální tisk, a zúžíme výběr. Poté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % a 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru. |
===== Přehled existujících subkorpusů ===== | ===== Přehled existujících subkorpusů ===== |
| |
[{{ :manualy:kontext:subkorpus_prehled.png?direct&300|Přehled existujících uživatelových subkorpusů }}] | [{{ :manualy:kontext:subkorpus_prehled.png?direct&300|Přehled existujících uživatelových subkorpusů}}] |
| |
Sekce **Subkorpus → Mé subkorpusy** přináší přehled všech uživatelem definovaných subkorpusů. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvoření. Zároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá. | Sekce **Subkorpus → Mé subkorpusy** přináší přehled všech uživatelem definovaných subkorpusů. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvoření. Zároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá. Smazaný subkorpus je případně možné obnovit ze zálohy. |
| |
Ve výpisu se objevují všechny korpusy uživatele. Je třeba ovšem připomenout, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme beletristický subkorpus z korpusu [[cnk:syn2010|SYN2010]] na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu [[cnk:syn2005|SYN2005]]. | Ve výpisu se objevují všechny korpusy uživatele, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. Je však nutno mít na paměti, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme např. beletristický subkorpus z korpusu SYN2010 na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu SYN2005. |
| |
===== Používání subkorpusu ===== | ===== Používání subkorpusu ===== |
---- | ---- |
| |
| <WRAP center round box 48%> |
<WRAP center round box 44%> | **[[manualy:kontext:index|Menu]]**: [[manualy:kontext:novy_dotaz|Dotaz]] • [[manualy:kontext:subkorpus|Korpusy]] • [[manualy:kontext:ulozit|Uložit]] • [[manualy:kontext:konkordance|Konkordance]] • [[manualy:kontext:filtr|Filtr]] • [[manualy:kontext:frekvencni_distribuce|Frekvence]] • [[[[manualy:kontext:kolokace|Kolokace]] • [[moznosti_zobrazeni|Zobrazení]] • [[manualy:kontext:napoveda|Nápověda]] |
**[[manualy:kontext:index|Menu]]**: [[manualy:kontext:novy_dotaz|Dotaz]] • [[manualy:kontext:subkorpus|Subkorpusy]] • [[manualy:kontext:ulozit|Uložit]] • [[manualy:kontext:konkordance|Konkordance]] • [[manualy:kontext:filtr|Filtr]] • [[manualy:kontext:frekvencni_distribuce|Frekvence]] • [[[[manualy:kontext:kolokace|Kolokace]] • [[moznosti_zobrazeni|Zobrazení]] • [[manualy:kontext:napoveda|Nápověda]] | |
</WRAP> | </WRAP> |