AplikaceAplikace
Nastavení

This is an old revision of the document!


Menu: Concordance

Concordance list

The basic type of query evaluation is concordance, in particular the concordance list. It is a list of all verbs or phrases which fit the (KWIC) query, along with their right and left contexts, possibly also with information about the source text. A long concordance list is usually divided into several pages, and it is possible to switch between them with the help of the arrows placed in the header and footer of the concordance list. Display parameter settings (the number of rows on a page, length of context etc.) can be changed with the View option.

FIXME V následujících oddílech jsou popsány funkcionality stránky, základy práce s konkordančním seznamem, třídění, promíchání seznamu a vytváření vzorku. Další práci s konkordancí (filtrování, frekvenční a kolokační analýze) jsou věnovány zvláštní stránky odpovídající dalším položkám menu.

Pod logem KonTextu je umístěna navigace, která jednak poskytuje základní informace o prohledávaném korpusu (položka Korpus), jednak umožňuje upravit prvotní formulaci dotazu (položka Dotaz) i změnit případné navazující úpravy nad konkordančním seznamem (promíchání a další položky odpovídající úpravám).

Navigace s posloupností úprav FIXME



Text odkazu v položce Dotaz vždy zjednodušeně zobrazuje uživatelem zadaný dotaz, za ním je v závorce uveden počet výskytů. Dotaz lze pomocí odkazu zobrazit (včetně zvoleného korpusu a všech podmínek) i editovat, tj. změnit jeho parametry přímo nad vyhledanou konkordancí (bez nutnosti iniciovat nový dotaz). Tuto funkci oceníte zejména v případě, že chcete původní dotaz zpřesnit či doladit. Při editaci dotazu se zároveň musíte rozhodnout, zda se mají vykonat i následující operace nad konkordancí. Jejich součástí je i užitečná operace promíchání (lze ji jednorázově spustit z menu Konkordance → Promíchání nebo nastavit jako základní v menu Zobrazení → Obecné volby zobrazení, podrobněji viz oddíl níže), proto je obvykle vhodné ponechat volbu Automaticky provést i následující operace zaškrtnutou.

Následující položky na řádku pak zastupují jednotlivé kroky v posloupnosti úprav, které mění podobu a rozsah konkordance. S nimi je možné pracovat analogicky jako s úvodním dotazem.

Popis složitějšího dotazu FIXME


Popis dotazu s posloupností všech úprav konkordance je nakonec ještě k dispozici v přehledné tabulkové podobě po kliknutí na poslední odkaz podrobnosti.

Besides editation the user is also able to return to the individual steps and intermediate phases, and so renew the form of the concordance from any of the previous steps. Například se zde můžeme snadno vrátit k výchozímu (a následně promíchanému) konkordančnímu seznamu pomocí odkazu Zobrazit na druhém řádku s operací promíchání.

Query overview thus allows for an exact query specification for future use, e.g. in a research report, scientific paper etc. It is a more complex and more general variant of the simple Undo button in a web browser. Zatímco Popis dotazu umožňuje procházet a editovat operace nad konkordancí, pomocí tlačítka Zpět lze procházet (ovšem jen v pevně daném pořadí) jak konkordance, tak například výsledky frekvenční nebo kolokační analýzy. FIXME

Working with concordance

Introduction

The concordance list is divided into several parts. Highlighted in the centre is the KWIC, which is surrounded by the left and right context. In the left-hand column each row contains some brief information about the source text (its content depends on the settings in the View) menu. In the header of the concordance we can find basic information such as absolute frequency, relative frequency (i.p.m.), ARF and concordance status (whether it is sorted or shuffled). Arrows for browsing the individual pages of the concordance are placed on the far right.

Further information about the text

More detailed information about the text from which the specific concordance line originates is displayed after clicking on the metainformation listed in colour on the left of each line. The detailed metainformation then appears in the window at the bottom of the concordance list, which contains all of the information about the given text and the structures in which the KWIC is found (see lists of abbreviations used).

Concordance with wider context


Text surroundings of the KWIC

The text surroundings of the key word can be widened either for all concordance lines (see menu View → General view options, function KWIC Context size (positions)) or it is possible to view the wider context of only one concordance line in more detail in a separate window which appears after we click on KWIC. Here it is possible (to a limited degree) to widen the context with the help of the blue arrows at the beginning and at the end of the sample.

FIXME V novějších psaných korpusech (počínaje SYN2020 a SYN verze9) lze přepnout mezi dvěma možnostmi zobrazení okna: základní zobrazení textového okolí odpovídající tokenizaci daného korpusu, nebo zobrazení formátovaného textu zachovávající tokenizaci a do určité míry i typografickou podobu zdrojového textu (toho lze například využít pro přehlednější zobrazení poezie).

Rozšíření kontextu v mluvených korpusech a jeho zobrazení podle promluv

V mluvených korpusech je rovněž možné přepnout mezi dvěma možnostmi zobrazení: lineární zobrazení (stejně jako v psaných korpusech), nebo zobrazení podle promluv jednotlivých mluvčích. Zobrazení dialogu podle promluv jednotlivých mluvčích usnadňuje orientaci v transkriptech mluveného jazyka.

Syntactic graph

V případě, že je korpus syntakticky označkován (např. SYN2015), nachází se mezi zaškrtávacím políčkem a metainformací o textu ikonka sloužící k vyvolání syntaktického grafu. FIXME

Manual labelling of concordance lines

At the far left of every line we can also find a selection box for manual labelling of the individual concordance lines.

Portions of labelled groups of lines

Labelling can be done in two modes:

  • basic: selection of specific concordance lines with the option of either selecting or not selecting each specific item.
  • groups: a general classification of concordance lines into groups (e.g. according to meaning) labelled by numbers which the user selects

During the labelling in both modes a link with the continuously updated number of selected lines appears in the header of the concordance list. The two modes differ in the options of further work with the labelled lines which are available after clicking on the link: while the basic selection only leads to the deletion or preservation of the given lines in the concordance, the options of working with groups are much wider. In this case, however, the first step required by Kontext is to save the given group classification, which is necessary for maintaining persistence– after saving the URL changes so that it remains as an unambiguous indicator of the input query and also the classification. Following this, it is possible to view some basic statistics of the given groups, sorting concordance according to them, or also return to further editing of the group classification. Switching to the page with the first selected line at any time is convenient for large, multi-page concordances.

Functions of menu items

Sorting

An easy way of finding one’s way around a large concordance is sorting, which lines up the concordance alphabetically, grouping analogous occurrences together.

Sorting form

The KonText interface provides several possible ways of alphabetically sorting concordances.

  1. Simple sorting
  2. Multilevel sorting

For the simple sorting we select the criterion based on which we are doing the sorting (we can choose from any positional or structural attribute) and the range of the sorting (whether we are sorting the KWIC, the right or left context). As a result we can have alphabetically sorted concordances e.g. according to the first preceding word, according to the form of the keyword, or according to the text type.

The option Number of tokens to sort determines the range of the context or KWIC (if it is a multi-word one) on which the sorting mechanism will focus. If we select the value 2 for the right context, the results will be sorted alphabetically according to the first and second words following the KWIC.

The options Ignore case and Backward are applied to both the simple and the multilevel sort. The option Ignore case determines whether lower-/uppercase (case-sensitive) will be distinguished during the sorting or whether they will count as one and the same symbol (case-insensitive). The second option enables traditional alphabetical sorting (unmarked) or retrograde sorting, i.e. alphabetical order according to the back of a word (not according to its beginning, as is usual).

Multilevel sort allows for the combination of all possible types of sorting into a hierarchy of maximally three levels. It is therefore possible to sort a concordance on the 1st level according to text type, and concordances with the same text type are then sorted on the 2nd level (e.g. according to the first right-hand context word) and on the 3rd level according to the keyword itself.

That a concordance has been sorted is indicated in the status bar of the concordance (next to its frequency information).

Shuffle

FIXME In the default settings, the concordance is ordered according to the order in which the search results (individual concordance lines) are found in the corpus (e.g. in the corpus SYN2015 the first texts are fiction, then non-fiction and finally journalistic). To má výhodu zejména v rychlejším vyhledání odpovídajících řádků. But in situations when the concordance is extensive and we need to acquire a representative sample (e.g. for manual analysis), je vhodnější pracovat s náhodně promíchanými řádky. Toho lze dosáhnout právě volbou Concordance → Shuffle. Výsledkem operace je promíchání jednotlivých řádek konkordance, které je sice náhodné, ale zároveň opakovatelné.

We recommend that the option Shuffle be used automatically, which ensures that every concordance, before being displayed, is randomized in this way. Trvalé nastavení promíchávání konkordančních řádek lze nastavit v menu Zobrazení → Obecné volby zobrazení (volba Automaticky promíchat konkordanční řádky). Such an approach functions as an effective prevention against drawing incorrect conclusions from studying a sample of results which originate from an unrepresentative set of texts. FIXME

The result of the operation Shuffle is the shuffling of the individual concordance lines. This shuffle is random, but it is repeatable. For every concordance there is a definite shuffle algorithm which causes the results after the first, second, third… n shuffle are the same after repeated trials on the same query. This guarantees the replicability of the corpus experiments and when the shuffled concordance is used.

Sample

An alternative to the shuffle, especially when working with an extensive concordance, is the creation of random samples (Concordance → Sample). The main advantage of this approach is the fact that an extensive concordance can be randomly reduced to an extent that it will be within the user's powers to analyze it. When we limit the concordance range in this way, it naturally also influences the absolute frequency of the results. However, if the sample is large enough, the relative frequency (i.e. the proportions between the studied phenomena) should remain preserved.

The Concordance → Permanent link function generates a permanent link to the concordance, which can be copied to the clipboard or later mentioned in an article, study, etc.

Menu: QueryCorporaSaveConcordanceFilterFrequencyCollocationViewHelp