Toto je starší verze dokumentu!
Obsah
Menu: Korpusy
Dostupné korpusy
Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu Korpusy → Dostupné korpusy. Vzhledem k velkému počtu korpusů a jejich verzí se při prvním přihlášení uživateli zobrazí předfiltrovaný seznam korpusů se štítkem čeština
(zahrnující jak korpusy řady SYN, tak i ORAL a mnohé specializované a hostované korpusy). Kompletní seznam všech korpusů v abecedním pořadí se zobrazí po kliknutí na volbu Zrušit výběr
úplně vlevo. Při dalším přihlášení si rozhraní KonText bude pamatovat poslední nastavení uživatele a zobrazí seznam v té podobě, v jaké si jej uživatel při poslední návštěvě sám navolil.
Vedle korpusů, na něž se vztahuje nějaké, zpravidla licenční omezení, je ikona v podobě zámečku . Pokud má uživatel zájem o přístup k takovému korpusu, může o něj kliknutím na ikonu zažádat a korpus mu bude podle licenčních možností zpřístupněn.
Podobně jako při volbě korpusu před vyhledáváním lze také seznam korpusů libovolně filtrovat podle různých kritérií. Jednou z možností je využití tzv. štítků charakterizujících každý korpus, dále je možné filtrovat podle jména korpusu nebo jeho části, případně podle velikosti (záložka Pokročilý filtr).
Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi oblíbené, jejím zhasnutím korpus z oblíbených naopak vyřadíme.
Subkorpusy a paralelní korpusy na seznamu oblíbených
Za oblíbenou položku je možné označit nejenom celý samostatný korpus, ale také korpus včetně subkorpusu nebo zarovnané dvojice či trojice korpusů v rámci paralelního korpusu InterCorp, což práci s ním výrazně urychluje. Vzhledem k tomu, že se všechny kombinace subkorpusů a/nebo zarovnaných korpusů v seznamu dostupných korpusů pochopitelně objevit nemůžou, je nutné je přidat mezi oblíbené tehdy, jsou-li zvoleny jako aktuální. Obecně platí, že po kliknutí na hvězdičku vedle názvu korpusu (subkorpusu) v okamžiku, kdy je daný korpus (subkorpus) zvolen jako aktuální pro vyhledávání, se do oblíbených automaticky uloží celá tato kombinace (případně včetně zarovnaných korpusů).
Práce se subkorpusy
Vytváření virtuálních subkorpusů (tj. podmnožin textů z výchozího korpusu) je v rozhraní KonText soustředěno do druhé položky hlavního menu. Zde je možné jednak vytvářet vlastní subkorpus a jednak spravovat stávající subkorpusy (práce s konceptem subkorpusu, prohlížení hotových subkorpusů, jejich archivace, mazání apod.).
Subkorpusy jsou vázané na uživatelský účet. Virtuální subkorpus má tak registrovaný uživatel přístupný na všech počítačích, kde se přihlásí svým přístupovým jménem a heslem. Výsledky hledání v každém jednotlivém subkorpusu jsou zároveň zobrazitelné ostatním uživatelům (např. zasláním odkazu na konkordance nebo tabulky frekvenčních distribucí vzniklé na datech subkorpusu). Celý subkorpus je také možné zveřejnit v databázi veřejných subkorpusů, pokud uživatel vyplní pole popisu subkorpusu, viz dále.
V obecné rovině je subkorpus pouze dodatečná podmínka, která se při hledání aplikuje na všechny dotazy. Hledáme-li např. lemma dřevo v beletristickém subkorpusu SYN2020:beletrie, znamená to, že za dotaz bude automaticky připojena podmínka within, která specifikuje, v jakých textech korpusu SYN2020 se má hledání provést.
Vytvoření nového subkorpusu
V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, vyplatí se vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu Omezit hledání při zadávání nového dotazu).
Zvolíme-li v menu Korpusy → Vytvořit nový subkorpus, zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu.
Při tvorbě subkorpusu je třeba specifikovat:
- výchozí korpus, z něhož budeme vybírat texty
- jméno subkorpusu, tj. jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit
- v případě, že si přeji, aby byl subkorpus dohledatelný pomocí menu Korpusy → Veřejné subkorpusy, vyplním veřejný popis (pokud zůstane pole prázdné, bude subkorpus jako celek nedohledatelný)
- podmínku, na základě níž vybereme texty do subkorpusu
Podmínku je možné specifikovat buď CQL dotazem pomocí příkazu within, nebo výběrem hodnot strukturních atributů z připravené nabídky. V seznamu hodnot strukturních atributů jsou uvedena čísla reprezentující velikost textů v dané kategorii (údaj se týká počtu slov nebo počtu dokumentů). Na základě těchto údajů je možné vytvářet subkorpus s určitými proporcemi.
V rámci tohoto formuláře je možné zaškrtnout ty hodnoty vybraných strukturních atributů, které nás zajímají. Formulář neobsahuje všechny strukturní atributy, pouze ty nejpoužívanější v daném korpusu (např. při hledání v SYN2015 či SYN2020 jsou to txtype_group, txtype, genre, srclang). Použité zkratky je možné dohledat v příslušné sekci seznamů.
Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky Dotaz). V jednom ze sloupců se objevuje seznam konkrétních opusů nebo dokumentů, které odpovídají specifikované podmínce. Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít.
Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využít, zaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na Zúžit výběr. Tím se zpřístupní funkce Vlastní poměry typů textů. Pokud tedy například chceme subkorpus publicistiky ze SYN2015, který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry – NTW: celostátní tisk a REG: regionální tisk – a zúžíme výběr. Poté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % a 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru.
Berte prosím na vědomí, že použití více než jednoho strukturního atributu může snadno vést k zadání, jimž nelze vyhovět žádným výběrem textů z výchozího korpusu. V takovém případě subkorpus nebude vytvořen.
Vytvoření konceptu nového subkorpusu na stránce konkordančního dotazu
Subkorpus lze také předpřipravit jako koncept přímo na stránce konkordančního dotazu pod volbou Omezit hledání, po zaškrtání vybraných segmentů stačí kliknout na volbu Uložit jako koncept subkorpusu. Aby byl subkorpus aktivní, je potřeba přejít do menu Korpusy → Mé subkorpusy, dohledat koncept subkorpusu v tabulce a pomocí ikonky ozubeného kola otevřít tabulku s vlastnostmi subkorpusu (viz Správa existujících subkorpusů).
Správa existujících subkorpusů
Sekce Korpusy → Mé subkorpusy přináší přehled všech uživatelem definovaných subkorpusů (nebo jejich připravených konceptů). V tabulce je vedle jejich jména i jejich velikost (v počtu pozic) a datum vytvoření. Pomocí ikonky ozubeného kolečka na řádku daného subkorpusu lze měnit jeho vlastnosti:
- Pokud je subkorpus zatím ve stavu konceptu, lze dokončit jeho nastavení (upravit jeho strukturu, doplnit jeho veřejný popis) a převést ho do aktivního stavu volbou Dokončit korpus na úvodní liště Soubor.
- Editovat výběr textů daného subkorpusu pomocí lišty Struktura subkorpusu lze pouze u konceptu subkorpusu. Pokud uživatel změní strukturu u již vytvořeného subkorpusu, je možné toto nastavení uložit pod novým subkorpusem s jedinečným identifikátorem.
- U každého subkorpusu lze měnit jeho název a také dohledatelnost doplněním či smazáním popisu na liště Název a veřejný popis.
- Pokud již uživatel neplánuje se subkorpusem aktivně pracovat, může ho Archivovat (pomocí tlačítka na úvodní liště Soubor). Subkorpus bude v takovém případě skryt v seznamu mých subkorpusů, nebude se nabízet na stránkách s vyhledáváním ani nebude veřejně dohledatelný. Vytvořené odkazy na výsledky hledání však budou nadále fungovat. V případě potřeby lze archivovaný subkorpus v seznamu mých subkorpusů i později zobrazit (zaškrtnutím volby Zobrazit i archivované korpusy) a obnovit ho do původního stavu.
- Subkorpusy lze také nevratně smazat kliknutím na tlačítko Odstranit na úvodní liště Soubor. I v tomto případě však budou uživatelům nadále fungovat dříve vytvořené odkazy na výsledky vyhledávání v daném subkorpusu.
Ve výpisu se objevují všechny korpusy uživatele, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. Je však nutno mít na paměti, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme např. beletristický subkorpus z korpusu SYN2020 na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu SYN2015.
Používání subkorpusů
Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce Korpusy → Mé subkorpusy nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu.
Veřejné subkorpusy
Subkorpusy je možné sdílet s ostatními uživateli za předpokladu, že mají přístup ke zdrojové korpusu, z něhož je subkorpus vytvořen. Každému veřejně přístupnému subkorpusu je přiřazen unikátní klíč (např. 7e06d19af7
), který je možné sdílet a podle něhož lze korpus v rámci menu Korpus > Veřejné subkorpusy vyvolat. Alternativně je možné veřejný subkorpus vyhledat rovněž podle příjmení autora.
Princip vytvoření veřejného subkorpusu je v podstatě identický s postupem pro vytvoření soukromého trvalého subkorpusu, jak byl popsán výše. Po vytvoření subkorpusu je pouze třeba v menu Mé subkorpusy zaškrtnout volbu povolující veřejnou přístupnost a vyplnit popis korpusu. Unikátní klíč lze zobrazit, pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku drobečkové navigace pod logem KonText).