AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
manualy:kontext:subkorpus [2015/10/05 14:39] – [Dostupné korpusy] michalskrabalmanualy:kontext:subkorpus [2018/07/30 15:52] – [Vytvoření nového subkorpusu] michalskrabal
Řádek 3: Řádek 3:
 ====== Dostupné korpusy ====== ====== Dostupné korpusy ======
  
-Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu **Korpusy → Dostupné korpusy**. Vzhledem k velkému počtu korpusů a jejich verzí se **při prvním přihlášení** uživateli zobrazí předfiltrovaný seznam korpusů se štítkem "čeština" (zahrnující jak korpusy řady SYN, tak i ORAL a mnohé specializované a hostované korpusy). Kompletní **seznam všech korpusů v abecedním pořadí** se zobrazí po kliknutí na „Zrušit výběr“. Při dalším přihlášení si rozhraní KonText bude pamatovat poslední nastavení uživatele a zobrazí seznam v té podobě, v jaké si jej uživatel při poslední návštěvě sám navolil.+Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu **Korpusy → Dostupné korpusy**. Vzhledem k velkému počtu korpusů a jejich verzí se **při prvním přihlášení** uživateli zobrazí předfiltrovaný seznam korpusů se štítkem "čeština" (zahrnující jak korpusy řady SYN, tak i ORAL a mnohé specializované a hostované korpusy). Kompletní **seznam všech korpusů v abecedním pořadí** se zobrazí po kliknutí na štítek „Zrušit výběr“ úplně vlevo. Při dalším přihlášení si rozhraní KonText bude pamatovat poslední nastavení uživatele a zobrazí seznam v té podobě, v jaké si jej uživatel při poslední návštěvě sám navolil.
  
 Vedle korpusů, na něž se vztahuje nějaké, zpravidla licenční omezení, je **ikona v podobě zámečku**. Pokud má uživatel zájem o přístup k takovému korpusu, po kliknutí na ikonu o něj může zažádat a korpus mu bude podle možností zpřístupněn. Vedle korpusů, na něž se vztahuje nějaké, zpravidla licenční omezení, je **ikona v podobě zámečku**. Pokud má uživatel zájem o přístup k takovému korpusu, po kliknutí na ikonu o něj může zažádat a korpus mu bude podle možností zpřístupněn.
  
-Podobně jako při [[manualy:kontext:novy_dotaz#volba_korpusu|volbě korpusu]] před vyhledáváním lze také seznam korpusů libovolně filtrovat podle různých kritérií. Jednou z možností je využití tzv. štítků charakterizujících každý korpus, dále je možné filtrovat podle jména korpusu nebo jeho části, případně podle velikosti (záložka //pokročilé//). Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi [[manualy:kontext:novy_dotaz#volba_korpusu|oblíbené]], jejím zhasnutím korpus z oblíbených naopak vyřadíme. +Podobně jako při [[manualy:kontext:novy_dotaz#volba_korpusu|volbě korpusu]] před vyhledáváním lze také seznam korpusů libovolně filtrovat podle různých kritérií. Jednou z možností je využití tzv. štítků charakterizujících každý korpus, dále je možné filtrovat podle jména korpusu nebo jeho části, případně podle velikosti (záložka //Pokročilé//). Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi [[manualy:kontext:novy_dotaz#volba_korpusu|oblíbené]], jejím zhasnutím korpus z oblíbených naopak vyřadíme. 
  
-**Subkorpusy a paralelní korpusy na seznamu oblíbených**+=== Subkorpusy a paralelní korpusy na seznamu oblíbených ===
  
 Za oblíbenou položku je možné označit nejenom celý samostatný korpus, ale také korpus včetně subkorpusu nebo zarovnané dvojice či trojice korpusů v rámci paralelního korpusu [[cnk:intercorp|InterCorp]], což práci s ním výrazně urychluje. Vzhledem k tomu, že se všechny kombinace subkorpusů a/nebo zarovnaných korpusů v seznamu dostupných korpusů pochopitelně objevit nemůžou, je nutné je přidat mezi oblíbené tehdy, když jsou zvoleny jako aktuální. Obecně platí, že po kliknutí na hvězdičku vedle názvu korpusu (subkorpusu) v okamžiku, kdy je daný korpus (subkorpus) zvolen jako aktuální pro vyhledávání, se do oblíbených automaticky uloží celá tato kombinace (případně včetně zarovnaných korpusů). Za oblíbenou položku je možné označit nejenom celý samostatný korpus, ale také korpus včetně subkorpusu nebo zarovnané dvojice či trojice korpusů v rámci paralelního korpusu [[cnk:intercorp|InterCorp]], což práci s ním výrazně urychluje. Vzhledem k tomu, že se všechny kombinace subkorpusů a/nebo zarovnaných korpusů v seznamu dostupných korpusů pochopitelně objevit nemůžou, je nutné je přidat mezi oblíbené tehdy, když jsou zvoleny jako aktuální. Obecně platí, že po kliknutí na hvězdičku vedle názvu korpusu (subkorpusu) v okamžiku, kdy je daný korpus (subkorpus) zvolen jako aktuální pro vyhledávání, se do oblíbených automaticky uloží celá tato kombinace (případně včetně zarovnaných korpusů).
Řádek 25: Řádek 25:
 [{{ :manualy:kontext:subkorpus_vytvorit.png?direct&300|Vytváření nového subkorpusu }}] [{{ :manualy:kontext:subkorpus_vytvorit.png?direct&300|Vytváření nového subkorpusu }}]
  
-V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Specifikovat dotaz podle metainformací]] při zadávání nového dotazu). 
  
-Zvolíme-li v menu **Subkorpus → Vytvořit nový**zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat:+V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:kontext:novy_dotaz#omezit_hledani|Omezit hledání]] při zadávání nového dotazu).
  
-  - výchozí korpus, z něhož budeme vybírat texty +Zvolíme-li v menu **Korpusy → Vytvořit nový subkorpus**, zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat: 
-  - jméno subkorpusu, jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit + 
-  - podmínku, na základě které vybereme texty do subkorpusu+  - výchozí korpus, z něhož budeme vybírat texty, 
 +  - jméno subkorpusu, jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit, 
 +  - podmínku, na základě které vybereme texty do subkorpusu.
  
 Podmínku je možné specifikovat buď [[pojmy:dotazovaci_jazyk|CQL]] dotazem pomocí příkazu [[kurz:subkorpusy|within]], nebo výběrem hodnot [[pojmy:atributy_strukturni|strukturních atributů]] z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů v dané kategorii). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. Podmínku je možné specifikovat buď [[pojmy:dotazovaci_jazyk|CQL]] dotazem pomocí příkazu [[kurz:subkorpusy|within]], nebo výběrem hodnot [[pojmy:atributy_strukturni|strukturních atributů]] z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů v dané kategorii). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi.
Řádek 37: Řádek 38:
 V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v [[cnk:syn2010|SYN2010]] jsou to [[pojmy:txtype_group|txtype_group]], [[pojmy:txtype|txtype]], [[pojmy:genre|genre]], [[pojmy:medium|med]], [[pojmy:srclang|srclang]]). Použité zkratky je možné dohledat v příslušné sekci [[seznamy:index|seznamů]]. V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v [[cnk:syn2010|SYN2010]] jsou to [[pojmy:txtype_group|txtype_group]], [[pojmy:txtype|txtype]], [[pojmy:genre|genre]], [[pojmy:medium|med]], [[pojmy:srclang|srclang]]). Použité zkratky je možné dohledat v příslušné sekci [[seznamy:index|seznamů]].
  
-Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Dotaz]]) V posledním sloupci se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]] (v závislosti na zvoleném korpusu), které odpovídají specifikované podmínce. Pokud by takový seznam byl příliš dlouhý, je v daném sloupci uveden pouze počet položek. V případě, že si z nabídky zvolíme nějaké kategorie, můžeme si zobrazit soupis textů, které takovéto podmínce odpovídají, pomocí tlačítka **žit výběr** (vlevo dole). Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít.+Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#omezit_hledani|Dotaz]])V posledním sloupci se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]] (v závislosti na zvoleném korpusu), které odpovídají specifikované podmínce. Pokud by takový seznam byl příliš dlouhý, je v daném sloupci uveden pouze počet položek. V případě, že si z nabídky zvolíme nějaké kategorie, můžeme si zobrazit soupis textů, které takovéto podmínce odpovídají, pomocí tlačítka **žit výběr**. Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít
 + 
 +[{{ :manualy:kontext:subkorpus_50-50.png?direct&300|Subkorpus vytvořený z podle vlastních kritérií}}] 
 + 
 +Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využít, zaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na Zúžit výběr. Tím se zpřístupní funkce Vlastní poměry typů textů. Pokud tedy například chceme korpus publicistiky, který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry, NTW: celostátní tisk a REG: regionální tisk, a zúžíme výběr. Poté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % a 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru.
  
 ===== Přehled existujících subkorpusů ===== ===== Přehled existujících subkorpusů =====
  
-[{{ :manualy:kontext:subkorpus_prehled.png?direct&300|Přehled existujících uživatelových subkorpusů }}]+[{{ :manualy:kontext:subkorpus_prehled.png?direct&300|Přehled existujících uživatelových subkorpusů}}]
  
-Sekce **Subkorpus → Mé subkorpusy** přináší přehled všech uživatelem definovaných subkorpusů. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvoření. Zároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá.+Sekce **Korpusy → Mé subkorpusy** přináší přehled všech uživatelem definovaných subkorpusů. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvoření. Zároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá. Smazaný subkorpus je případně možné obnovit ze zálohy.
  
-Ve výpisu se objevují všechny korpusy uživatele. Je třeba ovšem připomenout, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme beletristický subkorpus z korpusu [[cnk:syn2010|SYN2010]] na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu [[cnk:syn2005|SYN2005]]+Ve výpisu se objevují všechny korpusy uživatele, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. Je však nutno mít na paměti, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme např. beletristický subkorpus z korpusu SYN2010 na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu SYN2005. 
  
 ===== Používání subkorpusu ===== ===== Používání subkorpusu =====
  
-Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce Subkorpus → Mé subkorpusy nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu.+Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce Korpusy → Mé subkorpusy nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu.
  
 ---- ----