AplikaceAplikace
Nastavení

Přehled verzí rozhraní KonText

Korpusový manažer KonText slouží pro všeobecnou práci s korpusy ČNK. Popis funkcí rozhraní KonText je dostupný v manuálu, podrobnější návod, jak využívat všech jeho možností najdete v kurzu práce s ČNK.

KonText je rozšířenou a graficky upravenou verzí původní aplikace NoSketch Engine, vyvíjenou v ÚČNK FF UK a na ÚFAL MFF UK pod licencí GNU GPL 2 (hlavními vývojáři jsou Tomáš Machálek a Martin Zimandl). Stejně jako NoSketch Engine používá i KonText jako výpočetní server program Manatee.

V tomto přehledu verzí vývoje KonTextu uvádíme pouze zásadnější změny, které můžou být zajímavé pro koncového uživatele. Úplný přehled všech změn a oprav je k dispozici v příslušném repozitáři na serveru GitHub, odkud je také možné stáhnout zdrojové kódy aplikace.

Verze 0.18.0

Datum zveřejnění: 7. 02. 2024

Uživatelské změny:

 • nový modul „Analýza klíčových slov“
 • zob­ra­zo­vání pře­kla­do­vých ekvi­va­lentů v pa­ra­lel­ních kor­pusech po klik­nutí na vy­brané slovo přímo v kon­ko­ranci (nový plug-in tokens_linking)
 • možnost stažení seznamu dokumentů vyhovujících vybraným typům textů
 • JSONL jako nový volitelný formát ukládání výsledků (konkordance, seznam slov, kolokace, frekvence, seznam dokumentů), kde je na každém řádku dokumentu samostatný JSON řetězec – formát je vhodný zejména pro další strojové zpracování dat
 • vylepšení odkazování z externích aplikací do KonTextu
  • vícekrokové operace (např. dotaz + filtr) s možností následné editace ve formulářích dotazů
  • podpora pro jiné než tokenové rozsahy filtrů při odkazování do KonTextu (např. „od -1s do 1s“)
 • modul „Federated Content Search“ podporuje hledání ve více korpusech najednou

Technické změny:

 • zrušení podpory pro Celery v roli výpočetního backendu (zůstává Rq)
 • nový interní HTTP klient pro dotazování externích zdrojů dat (autentizace, překladové ekvivalenty apod.)
 • vylepšený instalační skript
 • KonText používá (volitelně) vlastní modifikaci Manatee-open s větším množstvím statistických měr pro analýzu klíčových slov

Verze 0.17.0

Datum zveřejnění: 17. 02. 2023

Uživatelské změny:

 • přepracovaný systém subkorpusů
  • implicitně je každý subkorpus dostupný ostatním uživatelů - tj. není problém s prohlížením sdílených URL s výsledky.
  • pokud uživatel nevyplní popis, subkorpus není dohledatelný.
  • subkorpus je možno archivovat - URL adresy zůstanou funkční, autorovi se subkorpus nebude zobrazovat ve výpisu (lze zobrazit změnou parametru filtru).
  • na stránce konkordančního dotazu si lze aktuální výběr typů textů uložit jako koncept subkorpusu a později ho dokončit.
  • subkorpus je snadné zkopírovat či vytvořit jeho variantu dalším výběrem textů.
 • funkce disperze - grafické znázornění počtů výskytů hledaného výrazu na ose představující celý korpus tak, jak jdou slova a dokumenty ve vertikále za sebou
 • zvýraznění překladových ekvivalentů - na stránce příslušné paralelní konkordance je možné zvýraznit slova odpovídající překladům nalezeným přes Treq
 • odkaz sdílet tabulku frekv. distribuce
  • obsahuje-li stránka frekvenční distribuce více tabulek (grafů), je možné získat ke každé z nich URL odkaz pro případné sdílení či publikaci
 • výběr konkord. řádků - funkce přejít na stránku prvního vybraného řádku
  • v případě, že si uživatel kategorizuje konkordanční řádky a příslušný výběr začíná až někde daleko za první stránkou, lze se dostat na začátek výběru pomocí této nové funkce
 • možnost přidávat do KonTextu specifické zpětné odkazy (tato funkce je dostupná pro snazší integraci s ostatními aplikacemi)
 • detekce příliš časově náročných dotazů s možností přenesení takových dotazu do doporučeného menšího korpusu

Technické změny:

 • změna frameworku a webserveru z Gunicorn+Werkzeug na Sanic)
 • upgrade na React 18
 • přepis serverového backendu do asychronních funkcí (async+await)
 • výchozí použití WebSockets pro kontrolu úloh běžících na pozadí (vytváření některých subkorpusů, větší konkordance)
 • podpora Manatee 2.2xx
 • vylepšení cachování výsledků frekvenčních distribucí pro rychlejší pohyb po stránkách s výsledky
 • přechod od HTTP sessions na JWT
 • možnost aplikovat individuální „cutoff“ na velikost konkordance

Verze 0.16.0

Datum zveřejnění: 23. 02. 2022

Uživatelské změny:

 • nový typ dotazu: paradigmatický dotaz
 • vylepšený typ dotazu „seznam slov“
  • lepší provedení rozhraní formuláře
  • optimalizace ukládání výsledků pro rychlejší přístup a stránkování
 • historie dotazů podporuje všechny typy dotazování (konkordance, seznam slov, paradigmatický dotaz)
 • vylepšení frekvenční distribuce
  • grafický režim zobrazení frekvenčních distribucí
   • speciální podpora pro časové informace
  • zobrazení konfidenčních intervalů
  • možnost nastavit si výchozí druh zobrazení (tabulky vs. grafy)
 • vylepšený přehrávač audia
  • možnost posunu přehrávání v čase
  • zobrazení průběhu (waveform)
 • možnost vytvořit subkorpus přímo na stránce konkordančního dotazu
 • našeptávač s podporou sublemmat (syn2020, syn_v9) a rychlejší odezvou

Technické změny:

 • integrace řady modulů (např. „liveattrs“, historie dotazů) s databázovým systémem ČNK
 • reorganizace a modernizace serverového kódu
 • přechod od CSS souborů ke Styled Components
 • podpora pro Docker
 • podpora pro automatické testování uživatelského rozhraní
 • odstranění nepotřebných atributů z konfigurace

Verze 0.15.0

Datum zveřejnění: 18. 12. 2020

Uživatelské změny:

 • změna typů dotazu na dva:
  • pokročilý (stejné funkce jako původní CQL)
  • jednoduchý
   • víceslovné hledání
   • volitelné regulární výrazy
   • volitelné výchozí atributy (v závislosti na korpusu)
 • nový prvek pro výběr časového intervalu v „Omezení hledání“ založený na klikacím kalendáři
 • rozšíření plug-inu syntax_viewer - podpora nových vlastností v SYN2020
 • nový plug-in query_suggest poskytující nápovědu k aktuálně zapsanému dotazu
 • možnost použít plug-in token_connect jako altenativní zobrazení detailu KWIC
  • přidán modul „formátovaný text“
 • plug-in taghelper nyní podporuje i tagsety „klíč - hodnota“ a je možno též nastavit více tagsetů pro jeden korpus
 • nový způsob zobrazení dalších pozičních atributů - pod jednotlivá slova hlavního atributu
 • možnost nastavit jako hlavní atribut zobrazení libovolný poziční atribut
 • přehlednější modul „korpusová nastavení“
 • přepracované rozhraní dotazovacího formuláře v sekci „specifikovat kontext“
 • možnost provádět časově náročnější hledání (mld. korpusy, zarovnané korpusy s hledáním v jednom jazyce) bez časového omezení daného webovým serverem
 • možnost otevřít archivovanou URL adresu s výsledkem frekv. distribuce či kolokace spočtené nad většími konkordancemi, jejichž opětovné vytvoření by trvalo déle, než umožňuje limit pro běžnou interakci s KonTextem

Technické změny:

 • přepis serverové části do Python 3
 • podpora nového backendu Rq pro zpracování úloh na pozadí a jeho nasazení jako výchozího řešení
 • přepis klientské části do stejného frameworku, jaký používá aplikace WaG
 • přepis synchronizace webového serveru a výpočetního backendu při vytváření konkordancí
 • změny v HTTP API

Verze 0.13.0

Datum zveřejnění: 9. 12. 2019

 • přepis HTML šablon do systému Jinja2
 • přechod na framework React.JS, což se projevilo především rozsáhlými změnami v kódu a v menší míře také v uživatelských prvcích (např. nový vzhled korpusových nastavení zobrazení)
 • příprava na nasazení budoucí funkcionality

Verze 0.12.0

Datum zveřejnění: 30. 10. 2018

 • zobrazování překladových ekvivalentů z Trequ přímo v KonTextu při vyhledávání v paralelních korpusech (nastaveno pro InterCorp v10 a v11)
 • CQL editor s barevným zvýrazněním syntaxe a kontrolou názvů atributů a struktur
 • zjednodušení režimů zobrazení pozičních atributů (v textu, mouseover, kombinované)
 • možnost zveřejnit subkorpus spolu s jeho popisem
 • filtr - nové funkce
  • odstranit vnořené shody
  • první výskyty v dokumentu
 • přehlednější proces stahování výsledků do souboru
 • klávesové zkratky na stránce konkordance
 • možnost minimalizovat výpisy typů textu na stránce vytváření subkorpusu

Verze 0.11.0

Datum zveřejnění: 15. 12. 2017

 • 2-rozměrná frekvenční distribuce s intervalovými odhady skutečných hodnot (konfidenční intervaly), včetně exportu dat do Excelu
 • vylepšený interaktivní výběr textů - jednotlivé kroky výběru lze vracet zpět (undo)
 • vylepšená funkce interaktivního vytváření pozičních tagů - jednotlivé kroky výběru lze vracet zpět (undo)
 • vylepšená historie dotazů
  • vybrané položky je možné pojmenovat a trvale uložit
  • ukládá se kompletní stav formuláře (tedy např. i vybrané typy textů)
 • dopočítání i.p.m na vyžádání nyní funguje jen v dobře definovaných situacích (výběr textů pomocí checkboxů, ne vlastním CQL dotazem)
 • graf podílů ručně definovaných kategorií konkordančních řádků lze exportovat do Excelu
 • seznam slov:
  • nahraný black/white-list je nyní možno dále upravit přímo v prohlížeči
  • na stránce s výsledky se lze na jedno kliknutí dostat na poslední stránku
 • možnost skrýt jednotlivé jazyky v konkordanci paralelních korpusů

Verze 0.10.0

Datum zveřejnění: 11. 4. 2017

 • u mluvených korpusů možnost zobrazení detailu konkordance ve formě dialogu s vyznačením mluvčích i jejich překryvů a s přehráváním po kliknutí na ikonku reproduktoru
 • možnost namixovat si vlastní poměry typů textu při vytváření subkorpusu
 • jednotlivé kroky práce s konkordancí v rámci drobečkové navigace jsou editovatelné, lze se tedy vracet ke starším operacím a měnit jejich parametry
 • přepnutí korpusu v úvodním formuláři nyní zachová dotaz, typ dotazu a rozlišování velikosti písmen
 • označené konkordanční řádky (v rámci třídění do skupin pomocí čísel) jsou nově barevně odlišené
 • hlavičky webových stránek nyní obsahují informaci o dotazu (využití u záložek a pro lepší orientaci v historii prohlížeče)

Verze 0.9.0

Datum zveřejnění: 26. 9. 2016

 • podpora zobrazování syntaktických struktur
 • asynchronní vytváření subkorpusu, u paralelních korpusů navíc s možností vzít v úvahu (ne)existenci zarovnání
 • při vytváření subkorpusu a specifikaci metainformací přidán „našeptávač“ možných hodnot daného atributu, jestliže jich pro zobrazení zůstává příliš mnoho
 • zobrazování pozičních atributů v konkordanci při přejetí myší (tzv. mouse-over)
 • přechod mezi stránkami konkordance bez opětovného načítání stránky
 • ukládání výsledků frekvenční distribuce a kolokační analýzy do cache pro rychlejší přesun mezi stránkami
 • podpora pro přejmenovávání a mazání skupin konkordančních řádek
 • podpora zobrazování čísel řádků v konkordanci

Verze 0.8.0

Datum zveřejnění: 8. 3. 2016

 • podpora pro manualní rozřazování konkordančních řádek do skupin (označených čísly)
 • výpočet i.p.m. u subkorpusů (na kliknutí; předchozí verze počítaly i.p.m. z celého korpusu, což mohlo být matoucí)
 • subkorpus lze vytvořit pomocí podmínek na různé struktury (např. <speaker sex="male" /> a <session id="foo.+" />)
 • drobečková navigace ukazující postup při práci na dotazu

Verze 0.7.0

Datum zveřejnění: 5. 10. 2015

 • nová komponenta pro výběr korpusu obsahující mj. oblíbené a vlajkové korpusy
 • přepracované menu Nastavení
 • zjednodušení uživatelské práce s rozhraním (např. přidání zarovnaného korpusu)