AplikaceAplikace
Nastavení

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
en:manualy:kontext:korpusy [2023/03/07 16:10] Jan Křivanen:manualy:kontext:korpusy [2023/03/13 15:17] (current) David Lukeš
Line 1: Line 1:
 ====== Menu: Corpora ====== ====== Menu: Corpora ======
  
-FIXME První položka menu **Dostupné korpusy** otevře stránku, na níž má uživatel možnost vyhledat všechny korpusy, k nimž má přístup.+The first menu item **Available corpora** shows a list of accessible corpora which can be filtered according to various criteria.
  
-Zbylé tři položky jsou věnovány **[[kurz:subkorpusy|virtuálním subkorpusům]]** (tjpodmnožinám textů z výchozího korpusu). Zde je možné jednak vytvářet vlastní [[pojmy:subkorpus|subkorpus]] a jednak spravovat stávající subkorpusy (práce s konceptem subkorpusuprohlížení hotových subkorpusůjejich archivacemazání apod.). +The remaining three items are dedicated to **virtual subcorpora** (i.e. subsets of texts from the original corpus). Here it is possible both to create your own subcorpus and to manage existing subcorpora (work on a subcorpus draft, view existing subcorporaarchive themdelete themetc.).
  
-Subcorpora are tied to the user account. Virtual subcorpora are therefore available to [[en:kurz:zaciname|registered]] users from any computer, provided that they sign in with their username and password. Výsledky hledání v každém jednotlivém subkorpusu jsou zároveň zobrazitelné ostatním uživatelům (napřzasláním odkazu na konkordance nebo tabulky frekvenčních distribucí vzniklé na datech subkorpusu). Celý subkorpus je také možné zveřejnit mezi veřejnými subkorpusy, pokud uživatel vyplní pole veřejného popisu subkorpusu.+Subcorpora are tied to the user account. Virtual subcorpora are therefore available to [[en:kurz:zaciname|registered]] users from any computer, provided that they sign in with their username and password. The search results in each individual subcorpus are also visible to other users (e.g. by sending a link to concordances or frequency distribution tables created on the subcorpus data). The subcorpus itself can also be made public if the user fills in the public subcorpus description field.
  
-Generally speaking, a subcorpus is only an additional condition which is applied to all queries in the search. For example, if we are searching for the lemma //dřevo// in the fiction subcorpus SYN2020:beletrie, the query will automatically add the condition [[en:pojmy:within|within]], which specifies the texts of the corpus [[en:cnk:syn2020|SYN2020]] in which the search is to be conducted. FIXME+Generally speaking, a subcorpus is only an additional condition which is applied to all queries in the search. For example, if we are searching for the lemma //dřevo// in the fiction subcorpus SYN2020:beletrie, the query will automatically add the condition [[en:pojmy:within|within]], which specifies the texts of the corpus [[en:cnk:syn2020|SYN2020]] in which the search is to be conducted. 
  
-====== Available Corpora ======+===== Available Corpora =====
  
 A list of all the corpora available to the user are accessible via the menu item **Corpora → Available corpora**. Due to the large number of corpora and their respective versions, **following the first login**, the user is shown a pre-filtered list of corpora with the label “Czech” (containing both the SYN series corpora, and the ORAL series, and many specialized and hosted corpora). A complete **list of all corpora in alphabetical order** appears after clicking on the label “Reset,“ on the far left. With all following visits the KonText interface will remember the user’s most recent settings and will display a list just as how the user had himself compiled it during his last visit. A list of all the corpora available to the user are accessible via the menu item **Corpora → Available corpora**. Due to the large number of corpora and their respective versions, **following the first login**, the user is shown a pre-filtered list of corpora with the label “Czech” (containing both the SYN series corpora, and the ORAL series, and many specialized and hosted corpora). A complete **list of all corpora in alphabetical order** appears after clicking on the label “Reset,“ on the far left. With all following visits the KonText interface will remember the user’s most recent settings and will display a list just as how the user had himself compiled it during his last visit.
Line 32: Line 32:
   - a default corpus, from which the text will be selected   - a default corpus, from which the text will be selected
   - a subcorpus name, an unambiguous identifier which has not been previously used in the list of existing subcorpora   - a subcorpus name, an unambiguous identifier which has not been previously used in the list of existing subcorpora
-  - FIXME v případě, že si přejeme, aby byl subkorpus dohledatelný pomocí stránky **Korpusy → Veřejné subkorpusy**, vyplníme veřejný popis (pokud zůstane pole prázdnébude subkorpus jako celek nedohledatelný)+  - if we wish the subcorpus to be publicly accessible via the page **Corpora → Public subcorpora**, we fill in the public description (if the field is left blank, the subcorpus will not appear therethough individual query results will still be public)
   - a condition based on which we select the text for the subcorpus   - a condition based on which we select the text for the subcorpus
  
Line 41: Line 41:
 Selection is governed by the same principles as in the case of query specification according to metainformation (see description of item [[en:manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Query]]). In the last column, a list of specific [[en:pojmy:opus|opuses]] or [[en:pojmy:doc|documents]] appears (based on the selected corpus), and these meet a specified condition. If such a list should be too long, the given column contains only the number of items. If we select several categories out of the options, we can then view a list of texts meeting these conditions with the button **refine** (bottom left). The column containing the list of texts will update itself according to the currently selected criteria. We can continue thus until we are satisfied with the specification of the date which we want to use for our search. Selection is governed by the same principles as in the case of query specification according to metainformation (see description of item [[en:manualy:kontext:novy_dotaz#specifikovat_dotaz_podle_metainformaci|Query]]). In the last column, a list of specific [[en:pojmy:opus|opuses]] or [[en:pojmy:doc|documents]] appears (based on the selected corpus), and these meet a specified condition. If such a list should be too long, the given column contains only the number of items. If we select several categories out of the options, we can then view a list of texts meeting these conditions with the button **refine** (bottom left). The column containing the list of texts will update itself according to the currently selected criteria. We can continue thus until we are satisfied with the specification of the date which we want to use for our search.
  
-[{{ :manualy:kontext:subkorpus_50-50.png?direct&300|Subkorpus vytvořený podle vlastních kritérií}} FIXME]+[{{ :en:manualy:kontext:subkorpus_50-50.png?direct&300|Subcorpus created according to your own criteria}}]
  
-FIXME Je-li subkorpus vytvořen pomocí výběru hodnot strukturních atributůlze výsledný subkorpus kombinovat v konkordančním dotazu s ad hoc výběrem hodnot typů textukdy se na začátku automaticky předvyberou hodnoty odpovídající obsahu zvoleného subkorpusuDíky tomu je možné v subkorpusu dále upřesnit požadované typy textů.+If a subcorpus is created by selecting structural attribute valuesthe resulting subcorpus can be combined in a concordance query with an ad hoc selection of text type valueswhere the values corresponding to the content of the selected subcorpus are automatically preselected at the beginningThis makes it possible to further refine the desired text types in the subcorpus.
  
-Další možností je namíchat si subkorpus podle vlastních kritérií (např. 50 % textů z beletrie a 50 % z publicistiky). Chceme-li tuto funkci využítzaškrtneme si při vytváření subkorpusu rovnou požadované typy textů v rámci vybraného atributu a teprve pak klikneme na **Zúžit výběr**. Tím se zpřístupní funkce **Vlastní poměry typů textů**. Pokud tedy například chceme subkorpus publicistiky ze SYN2015, který bude obsahovat 50 % celostátního tisku a 50 % regionálního tisku (defaultně je v korpusu celostátního tisku 75 % a regionálního jen 25 %), zaškrtneme v políčku doc.genre oba požadované žánry -- NTW: celostátní tisk a REG: regionální tisk -- a zúžíme výběrPoté zvolíme funkci Vlastní poměry typů textů a změníme poměr na 50 % 50 %. Výsledný subkorpus bude obsahovat náhodně vybrané texty z obou žánrů v námi zvoleném poměru.+Another option is to automatically sample texts to satisfy user-specified proportions (e.g. 50% of texts from fiction and 50% of journalistic texts). If you want to use this featurewhen creating the subcorpus, tick the desired text types within the selected attribute and then click on **Refine selection**. This will make the **Custom text type proportions** function availableSo, for example, if we want a SYN2015 journalism subcorpus that contains 50% national press and 50% regional press (the default is 75% national press and 25% regional press), we check both desired genres -- NTW: national press and REG: regional press -- in the doc.genre field and narrow the selection. Then we select the Custom text type ratios function and change the ratios to 50% and 50%. The resulting subcorpus will contain randomly selected texts from both genres in the ratio we chose.
  
 <WRAP round important 60%> <WRAP round important 60%>
-Berte prosím na vědomíže použití více než jednoho strukturního atributu může snadno vést k zadání, jimž nelze vyhovět žádným výběrem textů z výchozího korpusu. V takovém případě subkorpus nebude vytvořen.+Please be aware that the use of more than one structural attribute can easily lead to specifications that cannot be satisfied by any selection of texts from the original corpus. In this caseno subcorpus will be created.
 </WRAP> </WRAP>
  
-==== Vytvoření konceptu nového subkorpusu na stránce konkordančního dotazu ==== +==== Creating a subcorpus draft on the concordance query page ====
- +
-FIXME The subcorpus can also be created directly on the concordance query page under the Restrict search option. After checking the selected segments just click on the **Save as subcorpus concept** option. Aby byl subkorpus aktivní, je potřeba přejít do menu **Korpusy  → Mé subkorpusy**, najít koncept subkorpusu v tabulce a pomocí ikonky ozubeného kola otevřít vlastnosti subkorpusu a následně ho dokončit (viz následující oddíl).+
  
 +The subcorpus can also be created directly on the concordance query page under the Restrict search option. After checking the selected segments just click on the **Save as a subcorpus draft** option. To make a subcorpus active, you need to go to the menu **Corpora → My subcorpora**, find the subcorpus draft in the table and use the gear icon to open the subcorpus properties and then finalize it (see the following section).
  
 ===== My subcorpora ===== ===== My subcorpora =====
Line 60: Line 59:
 [{{ :en:manualy:kontext:subkorpus_prehled.png?direct&400|A list of the user’s existing subcorpora }}] [{{ :en:manualy:kontext:subkorpus_prehled.png?direct&400|A list of the user’s existing subcorpora }}]
  
-FIXME The section **Corpora → My Subcorpora** provides a list of all the subcorpora (nebo jejich připravených konceptů) defined by the user. Next to their name in the table is also their size (in the number of [[en:pojmy:pozice|positions]]) and the date they were created. Simultaneously Na každém řádku lze pomocí ikonky ozubeného kolečka otevřít zvláštní nabídku měnit zde vlastnosti daného subkorpusu:+The section **Corpora → My subcorpora** provides a list of all the subcorpora (including drafts) defined by the user. The table lists their nametheir size (as the number of [[en:pojmy:pozice|positions]]) and the date they were created. Each line also contains gear icon you can use to open a special menu and change the properties of the subcorpus:
  
-  - Pokud je subkorpus ve stavu konceptulze dokončit jeho nastavení (upravit jeho strukturupřípadně doplnit jeho veřejný popisa převést ho do aktivního stavu volbou **Dokončit subkorpus** na úvodní liště Soubor+  - If the subcorpus is in draft statusyou can finalize its settings (modify its structureor add its public descriptionand convert it to active status by selecting **Finalize subcorpus** in the File tab  
-  - Změnit výběr textů daného subkorpusu pomocí lišty **Struktura subkorpusu** lze pouze u konceptu subkorpusuPokud však uživatel změní strukturu u již vytvořeného subkorpusuje následně možné pomocí volby **Uložit jako...** nastavení jednoduše zkopírovat do nového subkorpusu s novým názvem.  +  - Only drafts allow changing the text selection of a given subcorpus using the **Subcorpus structure** tabHoweverif the user changes the structure of an already created subcorpus, the settings can then be simply copied to a new subcorpus using the **Save as...** option
-  - U každého subkorpusu lze měnit jeho název a také veřejnou dohledatelnost doplněním či smazáním popisu na liště **Název a veřejný popis**. +  - For each subcorpus, the name can be changed and public availability can be modified by adding or deleting the description in the **Name and public description** tab
-  - Pokud již uživatel neplánuje se subkorpusem aktivně pracovatmůže ho archivovat (pomocí tlačítka **Archivovat** na úvodní liště Soubor). Subkorpus bude v takovém případě skryt v seznamu mých subkorpusůnebude se nabízet na stránkách s vyhledáváním ani nebude veřejně dohledatelnýVytvořené URL adresy výsledků hledání však budou nadále fungovatV případě potřeby lze archivovaný subkorpus v seznamu mých subkorpusů i později zobrazit (zaškrtnutím volby **Zobrazit i archivované korpusy**) a obnovit ho do původního stavu+  - If the user no longer plans to actively work with the subcorpusit can be archived (using the **Archive** button on the File tab). In this casethe subcorpus will be hidden in the My subcorpora list, will not appear on the search pages, and will not be publicly accessibleHowever, the URLs created for the search results will still workIf necessary, an archived subcorpus can also be displayed in the My subcorpora list at a later time (by checking **Show archived corpora as well**) and restored to its original state
-  - Subkorpusy lze také nevratně smazat kliknutím na tlačítko **Odstranit** na úvodní liště SouborV takovém případě již dojde k fyzickému odstranění všech dat subkorpusučímž přestanou platit i existující URL adresyTento postup je tedy vhodný spíše pro subkorpusykteré doposud nebyly mezi uživateli sdíleny, případně je-li vážný důvod k jejich odstranění.+  - Subcorpora can also be permanently deleted by clicking the **Delete** button in the File tabIn this caseall subcorpus data is irretrievably removed, and the existing URLs are no longer validThis procedure is therefore more appropriate for subcorpora that have not yet been shared between usersor if there is a serious reason to remove them.
  
-FIXME The list contains all of the user’s corpora, zároveň je lze filtrovat podle jednotlivých výchozích korpusů. However, it must be repeated that subcorpora ale always tied to the default (original) corpus. Therefore, if we create a fiction subcorpus from the corpus [[en:cnk:syn2020|SYN2020]] based on a general condition or by selecting one of the options, it doesn’t mean that we will also have at our disposition an analogical subcorpus of fiction from the corpus [[en:cnk:syn2015|SYN2015]].+The list contains all of the user’s subcorpora and allows for filtering based on the original parent corpus. However, it must be repeated that subcorpora ale always tied to the default (original) corpus. Therefore, if we create a fiction subcorpus from the corpus [[en:cnk:syn2020|SYN2020]] based on a general condition or by selecting one of the options, it doesn’t mean that we will also have at our disposition an analogical subcorpus of fiction from the corpus [[en:cnk:syn2015|SYN2015]].
  
 ==== Using subcorpora ==== ==== Using subcorpora ====
  
-Searching in the created subcorpus can by initiated by one click in the subcorpus in the menu Corpora → My subcorpora or by selecting a source corpus for the query and subsequently selecting in the drop-down menu, which is found next to the corpus specification.+Searching in the created subcorpus can by initiated by one click in the subcorpus in the menu **Corpora → My subcorpora** or by selecting a source corpus for the query and subsequently selecting in the drop-down menu, which is found next to the corpus specification.
  
 ===== Public subcorpora ===== ===== Public subcorpora =====
  
-FIXME Výsledky vyhledávání v subkorpusech lze zpřístupnit ostatním uživatelům jednoduchým odesláním odkazu (za předpokladu, že uživatelé mají přístup ke zdrojovému korpusu, z něhož je subkorpus vytvořen). Subkorpusy je však možné sdílet i jako celekto v případěže uživatel při vytváření korpusu (na stránce **Korpusy → Vytvořit nový subkorpus**) nebo při jeho editaci (v nabídce na stránce **Korpusy → Mé subkorpusy**) vyplní pole **Veřejný popis subkorpusu**. +The results of subcorpus searches can be made available to other users by simply sharing a link (assuming the users have access to the original parent corpus from which the subcorpus is derived). Howeverit is also possible to share subcorpora as a wholeif the user fills in the **Public subcorpus description** field when creating a subcorpus (on the **Corpora → Create new subcorpus** pageor editing it (in the menu on the **Corpora → My subcorpora** page)
  
-Každému subkorpusu je přiřazen unikátní klíč (např. ''7e06d19af7''), který je možné sdílet a podle něhož lze korpus v rámci menu **Korpus > Veřejné subkorpusy** vyvolatAlternativně je možné veřejný subkorpus vyhledat rovněž podle příjmení autoraUnikátní klíč lze zobrazit ve vlastnostech korpusu na stránce **Korpusy → Mé subkorpusy**, nebo pokud si uživatel vybere vytvořený korpus k práci a nechá si zobrazit informace o něm (odkaz na začátku drobečkové navigace pod logem KonText).+Each subcorpus is assigned a unique key (e.g. ''7e06d19af7''that can be shared and used to access the corpus from the menu **Corpus → Public subcorpora**. Alternatively, a public subcorpus can also be retrieved using the author's last nameThis unique key is displayed either in the subcorpus properties on the **Corpora → My subcorpora** page (by clicking on the gear icon), the search results on **Corpus → Public subcorpora**, or if the corpus is already selected, by clicking on its name at the beginning of the navigation with the concordance editing sequence under the KonText logo.
  
 ---- ----