Skrýt
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
manualy:kontext:subkorpus [2017/12/15 14:14]
Michal Škrabal
manualy:kontext:subkorpus [2018/08/03 15:23] (aktuální)
Václav Cvrček
Řádek 1: Řádek 1:
-====== MenuKorpusy ======+~~REDIRECT>​manualy:kontext:​korpusy~~
  
-====== ​Dostupné ​korpusy ======+====== ​Nepoužívat! Pouze redirect na menu:korpusy ======
  
-Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu **Korpusy → Dostupné korpusy**. Vzhledem k velkému počtu korpusů a jejich verzí se **při prvním přihlášení** uživateli zobrazí předfiltrovaný seznam korpusů se štítkem "​čeština"​ (zahrnující jak korpusy řady SYN, tak i ORAL a mnohé specializované a hostované korpusy). Kompletní **seznam všech korpusů v abecedním pořadí** se zobrazí po kliknutí na štítek „Zrušit výběr“ úplně vlevo. Při dalším přihlášení si rozhraní KonText bude pamatovat poslední nastavení uživatele a zobrazí seznam v té podobě, v jaké si jej uživatel při poslední návštěvě sám navolil. 
- 
-Vedle korpusů, na něž se vztahuje nějaké, zpravidla licenční omezení, je **ikona v podobě zámečku**. Pokud má uživatel zájem o přístup k takovému korpusu, po kliknutí na ikonu o něj může zažádat a korpus mu bude podle možností zpřístupněn. 
- 
-Podobně jako při [[manualy:​kontext:​novy_dotaz#​volba_korpusu|volbě korpusu]] před vyhledáváním lze také seznam korpusů libovolně filtrovat podle různých kritérií. Jednou z možností je využití tzv. štítků charakterizujících každý korpus, dále je možné filtrovat podle jména korpusu nebo jeho části, případně podle velikosti (záložka //​Pokročilé//​). Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi [[manualy:​kontext:​novy_dotaz#​volba_korpusu|oblíbené]],​ jejím zhasnutím korpus z oblíbených naopak vyřadíme. ​ 
- 
-=== Subkorpusy a paralelní korpusy na seznamu oblíbených === 
- 
-Za oblíbenou položku je možné označit nejenom celý samostatný korpus, ale také korpus včetně subkorpusu nebo zarovnané dvojice či trojice korpusů v rámci paralelního korpusu [[cnk:​intercorp|InterCorp]],​ což práci s ním výrazně urychluje. Vzhledem k tomu, že se všechny kombinace subkorpusů a/nebo zarovnaných korpusů v seznamu dostupných korpusů pochopitelně objevit nemůžou, je nutné je přidat mezi oblíbené tehdy, když jsou zvoleny jako aktuální. Obecně platí, že po kliknutí na hvězdičku vedle názvu korpusu (subkorpusu) v okamžiku, kdy je daný korpus (subkorpus) zvolen jako aktuální pro vyhledávání,​ se do oblíbených automaticky uloží celá tato kombinace (případně včetně zarovnaných korpusů). 
- 
-====== Práce se subkorpusy ====== 
- 
-[[kurz:​subkorpusy|Vytváření virtuálních subkorpusů]] (tj. podmnožin textů z výchozího korpusu) je v [[manualy:​kontext:​index|rozhraní KonText]] soustředěno do druhé položky hlavního menu. Zde je možné jednak vytvářet vlastní [[pojmy:​subkorpus|subkorpus]] a jednak spravovat stávající subkorpusy (prohlížení,​ mazání apod.). ​ 
- 
-Subkorpusy jsou vázané na uživatelský účet. Virtuální subkorpus má tak [[kurz:​zaciname|registrovaný]] uživatel přístupný na všech počítačích,​ kde se přihlásí svým přístupovým jménem a heslem. 
- 
-V obecné rovině je subkorpus pouze dodatečná podmínka, která se při hledání aplikuje na všechny dotazy. Hledáme-li např. lemma //dřevo// v beletristickém subkorpusu SYN2010:​beletrie,​ znamená to, že za dotaz bude automaticky připojena podmínka [[pojmy:​within|within]],​ která specifikuje,​ v jakých textech korpusu [[cnk:​syn2010|SYN2010]] se má hledání provést. 
- 
-===== Vytvoření nového subkorpusu ===== 
- 
-[{{ :​manualy:​kontext:​subkorpus_vytvorit.png?​direct&​300|Vytváření nového subkorpusu }}] 
- 
- 
-V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:​kontext:​novy_dotaz#​vybrat_texty|Vybrat texty]] při zadávání nového dotazu). 
- 
-Zvolíme-li v menu **Korpusy → Vytvořit nový subkorpus**,​ zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat:​ 
- 
-  - výchozí korpus, z něhož budeme vybírat texty, 
-  - jméno subkorpusu, jednoznačný identifikátor,​ který v rámci seznamu existujících subkorpusů ještě nebyl použit, 
-  - podmínku, na základě které vybereme texty do subkorpusu. 
- 
-Podmínku je možné specifikovat buď [[pojmy:​dotazovaci_jazyk|CQL]] dotazem pomocí příkazu [[kurz:​subkorpusy|within]],​ nebo výběrem hodnot [[pojmy:​atributy_strukturni|strukturních atributů]] z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů v dané kategorii). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi. 
- 
-V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v [[cnk:​syn2010|SYN2010]] jsou to [[pojmy:​txtype_group|txtype_group]],​ [[pojmy:​txtype|txtype]],​ [[pojmy:​genre|genre]],​ [[pojmy:​medium|med]],​ [[pojmy:​srclang|srclang]]). Použité zkratky je možné dohledat v příslušné sekci [[seznamy:​index|seznamů]]. 
- 
-Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:​kontext:​novy_dotaz#​vybrat_texty|Dotaz]]). V posledním sloupci se objevuje seznam konkrétních [[pojmy:​opus|opusů]] nebo [[pojmy:​doc|dokumentů]] (v závislosti na zvoleném korpusu), které odpovídají specifikované podmínce. Pokud by takový seznam byl příliš dlouhý, je v daném sloupci uveden pouze počet položek. V případě, že si z nabídky zvolíme nějaké kategorie, můžeme si zobrazit soupis textů, které takovéto podmínce odpovídají,​ pomocí tlačítka **Zúžit výběr**. Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít. 
- 
-[{{ :​manualy:​kontext:​subkorpus_50-50.png?​direct&​300|Subkorpus vytvořený z podle vlastních kritérií}}] 
- 
-Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využít, zaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na Zúžit výběr. Tím se zpřístupní funkce Vlastní poměry typů textů. Pokud tedy například chceme korpus publicistiky,​ který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry, NTW: celostátní tisk a REG: regionální tisk, a zúžíme výběr. Poté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % a 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru. 
- 
-===== Přehled existujících subkorpusů ===== 
- 
-[{{ :​manualy:​kontext:​subkorpus_prehled.png?​direct&​300|Přehled existujících uživatelových subkorpusů}}] 
- 
-Sekce **Korpusy → Mé subkorpusy** přináší přehled všech uživatelem definovaných subkorpusů. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:​pozice|pozic]]) a datum vytvoření. Zároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá. Smazaný subkorpus je případně možné obnovit ze zálohy. 
- 
-Ve výpisu se objevují všechny korpusy uživatele, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. Je však nutno mít na paměti, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme např. beletristický subkorpus z korpusu SYN2010 na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu SYN2005. ​ 
- 
-===== Používání subkorpusu ===== 
- 
-Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce Korpusy → Mé subkorpusy nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu. 
- 
----- 
- 
-<WRAP center round box 48%> 
-**[[manualy:​kontext:​index|Menu]]**:​ [[manualy:​kontext:​novy_dotaz|Dotaz]] • [[manualy:​kontext:​subkorpus|Korpusy]] • [[manualy:​kontext:​ulozit|Uložit]] • [[manualy:​kontext:​konkordance|Konkordance]] • [[manualy:​kontext:​filtr|Filtr]] • [[manualy:​kontext:​frekvencni_distribuce|Frekvence]] • [[[[manualy:​kontext:​kolokace|Kolokace]] • [[moznosti_zobrazeni|Zobrazení]] • [[manualy:​kontext:​napoveda|Nápověda]] 
-</​WRAP>​