AplikaceAplikace
Nastavení

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Následující verze
Předchozí verze
manualy:kontext:korpusy [2021/04/26 10:42] – [Vytvoření nového subkorpusu] Václav Cvrčekmanualy:kontext:korpusy [2023/03/31 16:26] (aktuální) – [Veřejné subkorpusy] Michal Škrabal
Řádek 1: Řádek 1:
 ====== Menu: Korpusy ====== ====== Menu: Korpusy ======
  
-====== Dostupné korpusy ======+První položka menu **Dostupné korpusy** otevře stránku, na níž má uživatel možnost vyhledat všechny korpusy, k nimž má přístup. 
 + 
 +Zbylé tři položky jsou věnovány **[[kurz:subkorpusy|virtuálním subkorpusům]]** (tj. podmnožinám textů z výchozího korpusu). Zde je možné jednak vytvářet vlastní [[pojmy:subkorpus|subkorpus]] a jednak spravovat stávající subkorpusy (práce s konceptem subkorpusu, prohlížení hotových subkorpusů, jejich archivace, mazání apod.).  
 + 
 +Subkorpusy jsou vázané na uživatelský účet. Virtuální subkorpus má tak [[kurz:zaciname|registrovaný]] uživatel přístupný na všech počítačích, kde se přihlásí svým přístupovým jménem a heslem. Výsledky hledání v každém jednotlivém subkorpusu jsou zároveň zobrazitelné ostatním uživatelům (např. zasláním odkazu na konkordance nebo tabulky frekvenčních distribucí vzniklé na datech subkorpusu). Celý subkorpus je také možné zveřejnit mezi veřejnými subkorpusy, pokud uživatel vyplní pole veřejného popisu subkorpusu. 
 + 
 +V obecné rovině je subkorpus pouze dodatečná podmínka, která se při hledání aplikuje na všechny dotazy. Hledáme-li např. lemma //dřevo// v beletristickém subkorpusu SYN2020:beletrie, znamená to, že za dotaz bude automaticky připojena podmínka [[pojmy:within|within]], která specifikuje, v jakých textech korpusu [[cnk:syn2020|SYN2020]] se má hledání provést. 
 + 
 +===== Dostupné korpusy =====
  
 Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu **Korpusy → Dostupné korpusy**. Vzhledem k velkému počtu korpusů a jejich verzí se při prvním přihlášení uživateli zobrazí předfiltrovaný seznam korpusů se štítkem ''čeština'' (zahrnující jak korpusy řady SYN, tak i ORAL a mnohé specializované a hostované korpusy). Kompletní seznam všech korpusů v abecedním pořadí se zobrazí po kliknutí na volbu ''Zrušit výběr'' úplně vlevo. Při dalším přihlášení si rozhraní KonText bude pamatovat poslední nastavení uživatele a zobrazí seznam v té podobě, v jaké si jej uživatel při poslední návštěvě sám navolil. Seznam všech korpusů, které jsou danému uživateli dostupné, je přístupný přes položku menu **Korpusy → Dostupné korpusy**. Vzhledem k velkému počtu korpusů a jejich verzí se při prvním přihlášení uživateli zobrazí předfiltrovaný seznam korpusů se štítkem ''čeština'' (zahrnující jak korpusy řady SYN, tak i ORAL a mnohé specializované a hostované korpusy). Kompletní seznam všech korpusů v abecedním pořadí se zobrazí po kliknutí na volbu ''Zrušit výběr'' úplně vlevo. Při dalším přihlášení si rozhraní KonText bude pamatovat poslední nastavení uživatele a zobrazí seznam v té podobě, v jaké si jej uživatel při poslední návštěvě sám navolil.
Řádek 11: Řádek 19:
 Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi [[manualy:kontext:novy_dotaz#volba_korpusu|oblíbené]], jejím zhasnutím korpus z oblíbených naopak vyřadíme.  Kliknutím na hvězdičku v pravém sloupci zařadíme korpus mezi [[manualy:kontext:novy_dotaz#volba_korpusu|oblíbené]], jejím zhasnutím korpus z oblíbených naopak vyřadíme. 
  
-=== Subkorpusy a paralelní korpusy na seznamu oblíbených ===+==== Subkorpusy a paralelní korpusy na seznamu oblíbených ====
  
 Za oblíbenou položku je možné označit nejenom celý samostatný korpus, ale také korpus včetně subkorpusu nebo zarovnané dvojice či trojice korpusů v rámci paralelního korpusu [[cnk:intercorp|InterCorp]], což práci s ním výrazně urychluje. Vzhledem k tomu, že se všechny kombinace subkorpusů a/nebo zarovnaných korpusů v seznamu dostupných korpusů pochopitelně objevit nemůžou, je nutné je přidat mezi oblíbené tehdy, jsou-li zvoleny jako aktuální. Obecně platí, že po kliknutí na hvězdičku vedle názvu korpusu (subkorpusu) v okamžiku, kdy je daný korpus (subkorpus) zvolen jako aktuální pro vyhledávání, se do oblíbených automaticky uloží celá tato kombinace (případně včetně zarovnaných korpusů). Za oblíbenou položku je možné označit nejenom celý samostatný korpus, ale také korpus včetně subkorpusu nebo zarovnané dvojice či trojice korpusů v rámci paralelního korpusu [[cnk:intercorp|InterCorp]], což práci s ním výrazně urychluje. Vzhledem k tomu, že se všechny kombinace subkorpusů a/nebo zarovnaných korpusů v seznamu dostupných korpusů pochopitelně objevit nemůžou, je nutné je přidat mezi oblíbené tehdy, jsou-li zvoleny jako aktuální. Obecně platí, že po kliknutí na hvězdičku vedle názvu korpusu (subkorpusu) v okamžiku, kdy je daný korpus (subkorpus) zvolen jako aktuální pro vyhledávání, se do oblíbených automaticky uloží celá tato kombinace (případně včetně zarovnaných korpusů).
  
-====== Práce se subkorpusy ======+===== Vytvořit nový subkorpus =====
  
-[[kurz:subkorpusy|Vytváření virtuálních subkorpusů]] (tj. podmnožin textů z výchozího korpusu) je v rozhraní KonText soustředěno do druhé položky hlavního menu. Zde je možné jednak vytvářet vlastní [[pojmy:subkorpus|subkorpus]] a jednak spravovat stávající subkorpusy (prohlížení, mazání apod.). +[{{ :manualy:kontext:subkorpus_vytvorit.png?direct&350|Vytváření nového subkorpusu }}]
  
-Subkorpusy jsou vázané na uživatelský účet. Virtuální subkorpus má tak [[kurz:zaciname|registrovaný]] uživatel přístupný na všech počítačích, kde se přihlásí svým přístupovým jménem a heslem. 
  
-obecné rovině je subkorpus pouze dodatečná podmínkakterá se při hledání aplikuje na všechny dotazy. Hledáme-li např. lemma //dřevo// beletristickém subkorpusu SYN2015:beletrie, znamená to, že za dotaz bude automaticky připojena podmínka [[pojmy:within|within]], která specifikuje, v jakých textech korpusu [[cnk:syn2015|SYN2015]] se má hledání provést.+případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusuvyplatí se vytvořit a na serveru uložit vlastní subkorpus (opačném případě, při ad hoc hledání podmnožině textůje lepší využít volbu [[manualy:kontext:novy_dotaz#omezit_hledani|Omezit hledání]] při zadávání nového dotazu).
  
-===== Vytvoření nového subkorpusu =====+Zvolíme-li v menu **Korpusy → Vytvořit nový subkorpus**, zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu
  
-[{{ :manualy:kontext:subkorpus_vytvorit.png?direct&300|Vytváření nového subkorpusu }}] +Při tvorbě subkorpusu je třeba specifikovat:
- +
- +
-V případě, že chceme dlouhodobě pracovat jenom s určitou skupinou textů v daném výchozím korpusu, se vyplatí vytvořit a na serveru uložit vlastní subkorpus (v opačném případě, při ad hoc hledání v podmnožině textů, je lepší využít volbu [[manualy:kontext:novy_dotaz#omezit_hledani|Omezit hledání]] při zadávání nového dotazu). +
- +
-Zvolíme-li v menu **Korpusy → Vytvořit nový subkorpus**, zobrazí se formulář pro vytváření permanentního virtuálního subkorpusu. Při tvorbě subkorpusu je třeba specifikovat:+
  
   - výchozí korpus, z něhož budeme vybírat texty   - výchozí korpus, z něhož budeme vybírat texty
-  - jméno subkorpusu, tj. jednoznačný identifikátor, který v rámci seznamu existujících subkorpusů ještě nebyl použit+  - jméno subkorpusu - libovolný název; název nemusí být unikátní ani v rámci jednoho korpusu, byť takový způsob pojmenování není doporučen z důvodu nepřehlednosti 
 +  - v případěže si přejeme, aby byl subkorpus dohledatelný pomocí stránky **Korpusy → Veřejné subkorpusy**, vyplníme veřejný popis (pokud zůstane pole prázdné, bude subkorpus jako celek nedohledatelný)
   - podmínku, na základě níž vybereme texty do subkorpusu   - podmínku, na základě níž vybereme texty do subkorpusu
  
Řádek 42: Řádek 45:
 Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#omezit_hledani|Dotaz]]). V jednom ze sloupců se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]], které odpovídají specifikované podmínce. Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít. Výběr se řídí stejnými principy jako v případě specifikace dotazu na základě metainformací (viz popis položky [[manualy:kontext:novy_dotaz#omezit_hledani|Dotaz]]). V jednom ze sloupců se objevuje seznam konkrétních [[pojmy:opus|opusů]] nebo [[pojmy:doc|dokumentů]], které odpovídají specifikované podmínce. Sloupec se seznamem textů se přepočítá podle aktuálně zaškrtnutých kritérií. Takto můžeme pokračovat do té doby, než budeme spokojeni s vymezením dat, která k hledání chceme použít.
  
 +[{{ :manualy:kontext:subkorpus_50-50.png?direct&350|Subkorpus vytvořený podle vlastních kritérií}}]
  
-[{{ :manualy:kontext:subkorpus_50-50.png?direct&300|Subkorpus vytvořený z podle vlastních kritérií}}]+Je-li subkorpus vytvořen pomocí výběru hodnot strukturních atributů, lze výsledný subkorpus kombinovat v konkordančním dotazu s ad hoc výběrem hodnot typů textu, kdy se na začátku automaticky předvyberou hodnoty odpovídající obsahu zvoleného subkorpusu. Díky tomu je možné v subkorpusu dále upřesnit požadované typy textů.
  
 Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využít, zaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na **Zúžit výběr**. Tím se zpřístupní funkce **Vlastní poměry typů textů**. Pokud tedy například chceme subkorpus publicistiky ze SYN2015, který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry -- NTW: celostátní tisk a REG: regionální tisk -- a zúžíme výběr. Poté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % a 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru. Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využít, zaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na **Zúžit výběr**. Tím se zpřístupní funkce **Vlastní poměry typů textů**. Pokud tedy například chceme subkorpus publicistiky ze SYN2015, který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry -- NTW: celostátní tisk a REG: regionální tisk -- a zúžíme výběr. Poté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % a 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru.
Řádek 51: Řádek 55:
 </WRAP> </WRAP>
  
-===== Přehled existujících subkorpusů =====+==== Vytvoření konceptu nového subkorpusu na stránce konkordančního dotazu ==== 
 + 
 +Subkorpus lze také připravit jako koncept přímo na stránce konkordančního dotazu pod volbou Omezit hledání. Po zaškrtání vybraných segmentů stačí kliknout na volbu **Uložit jako koncept subkorpusu**. Aby byl subkorpus aktivní, je potřeba přejít do menu **Korpusy  → Mé subkorpusy**, najít koncept subkorpusu v tabulce a pomocí ikonky ozubeného kola otevřít vlastnosti subkorpusu a následně ho dokončit (viz následující oddíl). 
 + 
 +===== Mé subkorpusy ===== 
 + 
 +[{{ :manualy:kontext:subkorpus_prehled.png?direct&500|Správa existujících uživatelových subkorpusů}}]
  
-[{{ :manualy:kontext:subkorpus_prehled.png?direct&400|Přehled existujících ivatelových subkorpusů }}]+Sekce **Korpusy → Mé subkorpusy** přináší přehled všech ivatelem definovaných subkorpusů (nebo jejich připravených konceptů) a umožňuje jejich správu. V tabulce je vedle jejich jména i jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvoření. Na každém řádku lze pomocí ikonky ozubeného kolečka otevřít zvláštní nabídku a měnit zde vlastnosti daného subkorpusu:
  
-Sekce **Korpusy → Mé subkorpusy** přináší přehled všech ivatelem definovaných subkorpusů. V tabulce je vedle jejich jména jejich velikost (v počtu [[pojmy:pozice|pozic]]) a datum vytvořeníZároveň zde má uživatel možnost smazat subkorpusy, které už nepoužívá. Smazaný subkorpus je případně možné obnovit ze zálohy.+  - Pokud je subkorpus ve stavu konceptu, lze dokončit jeho nastavení (upravit jeho strukturu, případně doplnit jeho veřejný popis) a převést ho do aktivního stavu volbou **Dokončit subkorpus** na úvodní liště Soubor. 
 +  - Změnit výběr textů daného subkorpusu pomocí lišty **Struktura subkorpusu** lze pouze u konceptu subkorpusu. Pokud však uživatel změní strukturu u již vytvořeného subkorpusu, je následně možné pomocí volby **Uložit jako...** nastavení jednoduše zkopírovat do nového subkorpusu s novým názvem.  
 +  - U každého subkorpusu lze měnit jeho název a také veřejnou dohledatelnost doplněním či smazáním popisu na liště **Název a veřejný popis**. 
 +  - Pokud již ivatel neplánuje se subkorpusem aktivně pracovat, může ho archivovat (pomocí tlačítka **Archivovat** na úvodní liště Soubor). Subkorpus bude v takovém případě skryt v seznamu mých subkorpusů, nebude se nabízet na stránkách s vyhledáváním ani nebude veřejně dohledatelný. Vytvořené URL adresy výsledků hledání však budou nadále fungovat. V případě potřeby lze archivovaný subkorpus v seznamu mých subkorpusů později zobrazit (zaškrtnutím volby **Zobrazit i archivované korpusy**) a obnovit ho do původního stavu. 
 +  - Subkorpusy lze také nevratně smazat kliknutím na tlačítko **Odstranit** na úvodní liště Soubor. V takovém případě již dojde k fyzickému odstranění všech dat subkorpusu, čímž přestanou platit i existující URL adresy. Tento postup je tedy vhodný spíše pro subkorpusy, které doposud nebyly mezi ivateli sdíleny, případně je-li vážný důvod k jejich odstranění.
  
-Ve výpisu se objevují všechny korpusy uživatele, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. Je však nutno mít na paměti, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme např. beletristický subkorpus z korpusu SYN2015 na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu SYN2010+Ve výpisu se objevují všechny korpusy uživatele, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. Je však nutno mít na paměti, že subkorpusy jsou vždy svázané s výchozím korpusem. Pokud tedy vytvoříme např. beletristický subkorpus z korpusu SYN2020 na základě obecné podmínky nebo výběrem z možností, neznamená to, že budeme mít k dispozici také analogický subkorpus beletrie z korpusu SYN2015
  
-===== Používání subkorpusu =====+==== Používání subkorpusů ====
  
 Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce **Korpusy → Mé subkorpusy** nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu. Vyhledání ve vytvořeném subkorpusu můžeme iniciovat jednak kliknutím na daný subkorpus v nabídce **Korpusy → Mé subkorpusy** nebo výběrem zdrojového korpusu při zadávání dotazu a následnou volbou v roletovém menu umístěném vedle specifikace korpusu.
Řádek 65: Řádek 79:
 ===== Veřejné subkorpusy ===== ===== Veřejné subkorpusy =====
  
-Subkorpusy je možné sdílet s ostatními ivateli za předpokladu, že mají  přístup ke zdrojové korpusu, z něhož je subkorpus vytvořen. Každému veřejně přístupnému subkorpusu je přiřazen unikátní klíč (např. ''7e06d19af7''), který je možné sdílet a podle něhož lze korpus rámci menu **Korpus > Veřejné subkorpusy** vyvolat. Alternativně je možné veřejný subkorpus vyhledat rovněž podle příjmení autora.+Výsledky vyhledávání v subkorpusech lze zpřístupnit ostatním ivatelům jednoduchým odesláním odkazu (za předpokladu, že uživatelé mají přístup ke zdrojovému korpusu, z něhož je subkorpus vytvořen)Subkorpusy je však možné sdílet i jako celek, a to v případě, že uživatel při vytváření korpusu (na stránce **Korpusy → Vytvořit nový subkorpus**nebo při jeho editaci (nabídce na stránce **Korpusy → Mé subkorpusy**) vyplní pole **Veřejný popis subkorpusu**
  
-Princip vytvoření veřejného subkorpusu je v podstatě identický s postupem pro vytvoření soukromého trvalého subkorpusu, jak byl popsán výše. Po vytvoření subkorpusu je pouze třeba v menu **Mé subkorpusy** zaškrtnout volbu povolující veřejnou ístupnost a vyplnit popis korpusu. Unikátní klíč lze zobrazit, pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku drobečkové navigace pod logem KonText).+Každému subkorpusu je přiřazen unikátní klíč (např. ''7e06d19af7''), který je možné sdílet a podle něhož lze korpus rámci menu **Korpusy → Veřejné subkorpusy** vyvolat. Alternativně je možné veřejný subkorpus vyhledat rovněž podle íjmení autora. Unikátní klíč lze zobrazit ve vlastnostech korpusu na stránce **Korpusy → Mé subkorpusy**nebo pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku navigace s posloupnostmi úprav konkordance pod logem KonText).
  
 ---- ----