AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
manualy:kontext:subkorpus [2015/10/07 14:32] vaclavcvrcekmanualy:kontext:subkorpus [2018/07/30 15:52] – [Vytvoření nového subkorpusu] michalskrabal
Řádek 25: Řádek 25:
 [{{ :manualy:kontext:subkorpus_vytvorit.png?direct&300|Vytváření nového subkorpusu }}] [{{ :manualy:kontext:subkorpus_vytvorit.png?direct&300|Vytváření nového subkorpusu }}]
  
-V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Specifikovat dotaz podle metainformací]] při zadávání nového dotazu). 
  
-Zvolíme-li v menu **Subkorpus → Vytvořit nový**zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat:+V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:kontext:novy_dotaz#omezit_hledani|Omezit hledání]] při zadávání nového dotazu).
  
-  - výchozí korpus, z něhož budeme vybírat texty +Zvolíme-li v menu **Korpusy → Vytvořit nový subkorpus**, zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat: 
-  - jméno subkorpusu, jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit + 
-  - podmínku, na základě které vybereme texty do subkorpusu+  - výchozí korpus, z něhož budeme vybírat texty, 
 +  - jméno subkorpusu, jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit, 
 +  - podmínku, na základě které vybereme texty do subkorpusu.
  
 Podmínku je možné specifikovat buď [[pojmy:dotazovaci_jazyk|CQL]] dotazem pomocí příkazu [[kurz:subkorpusy|within]], nebo výběrem hodnot [[pojmy:atributy_strukturni|strukturních atributů]] z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů v dané kategorii). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. Podmínku je možné specifikovat buď [[pojmy:dotazovaci_jazyk|CQL]] dotazem pomocí příkazu [[kurz:subkorpusy|within]], nebo výběrem hodnot [[pojmy:atributy_strukturni|strukturních atributů]] z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů v dané kategorii). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi.
Řádek 37: Řádek 38:
 V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v [[cnk:syn2010|SYN2010]] jsou to [[pojmy:txtype_group|txtype_group]], [[pojmy:txtype|txtype]], [[pojmy:genre|genre]], [[pojmy:medium|med]], [[pojmy:srclang|srclang]]). Použité zkratky je možné dohledat v příslušné sekci [[seznamy:index|seznamů]]. V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v [[cnk:syn2010|SYN2010]] jsou to [[pojmy:txtype_group|txtype_group]], [[pojmy:txtype|txtype]], [[pojmy:genre|genre]], [[pojmy:medium|med]], [[pojmy:srclang|srclang]]). Použité zkratky je možné dohledat v příslušné sekci [[seznamy:index|seznamů]].
  
-Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Dotaz]]) V posledním sloupci se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]] (v závislosti na zvoleném korpusu), které odpovídají specifikované podmínce. Pokud by takový seznam byl příliš dlouhý, je v daném sloupci uveden pouze počet položek. V případě, že si z nabídky zvolíme nějaké kategorie, můžeme si zobrazit soupis textů, které takovéto podmínce odpovídají, pomocí tlačítka **žit výběr** (vlevo dole). Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít.+Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#omezit_hledani|Dotaz]])V posledním sloupci se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]] (v závislosti na zvoleném korpusu), které odpovídají specifikované podmínce. Pokud by takový seznam byl příliš dlouhý, je v daném sloupci uveden pouze počet položek. V případě, že si z nabídky zvolíme nějaké kategorie, můžeme si zobrazit soupis textů, které takovéto podmínce odpovídají, pomocí tlačítka **žit výběr**. Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít
 + 
 +[{{ :manualy:kontext:subkorpus_50-50.png?direct&300|Subkorpus vytvořený z podle vlastních kritérií}}] 
 + 
 +Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využít, zaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na Zúžit výběr. Tím se zpřístupní funkce Vlastní poměry typů textů. Pokud tedy například chceme korpus publicistiky, který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry, NTW: celostátní tisk a REG: regionální tisk, a zúžíme výběr. Poté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % a 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru.
  
 ===== Přehled existujících subkorpusů ===== ===== Přehled existujících subkorpusů =====
  
-[{{ :manualy:kontext:subkorpus_prehled.png?direct&300|Přehled existujících uživatelových subkorpusů }}]+[{{ :manualy:kontext:subkorpus_prehled.png?direct&300|Přehled existujících uživatelových subkorpusů}}]
  
-Sekce **Subkorpus → Mé subkorpusy** přináší přehled všech uživatelem definovaných subkorpusů. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvoření. Zároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá.+Sekce **Korpusy → Mé subkorpusy** přináší přehled všech uživatelem definovaných subkorpusů. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvoření. Zároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá. Smazaný subkorpus je případně možné obnovit ze zálohy.
  
-Ve výpisu se objevují všechny korpusy uživatele. Je třeba ovšem připomenout, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme beletristický subkorpus z korpusu [[cnk:syn2010|SYN2010]] na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu [[cnk:syn2005|SYN2005]]+Ve výpisu se objevují všechny korpusy uživatele, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. Je však nutno mít na paměti, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme např. beletristický subkorpus z korpusu SYN2010 na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu SYN2005. 
  
 ===== Používání subkorpusu ===== ===== Používání subkorpusu =====
  
-Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce Subkorpus → Mé subkorpusy nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu.+Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce Korpusy → Mé subkorpusy nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu.
  
 ---- ----