AplikaceAplikace
Nastavení

Přehled verzí rozhraní KonText

Korpusový manažer KonText slouží pro všeobecnou práci s korpusy ČNK. Popis funkcí rozhraní KonText je dostupný v manuálu, podrobnější návod, jak využívat všech jeho možností najdete v kurzu práce s ČNK.

KonText je rozšířenou a graficky upravenou verzí původní aplikace NoSketch Engine, vyvíjenou v ÚČNK FF UK a na ÚFAL MFF UK pod licencí GNU GPL 2 (hlavními vývojáři jsou Tomáš Machálek a Martin Zimandl). Stejně jako NoSketch Engine používá i KonText jako výpočetní server program Manatee.

V tomto přehledu verzí vývoje KonTextu uvádíme pouze zásadnější změny, které můžou být zajímavé pro koncového uživatele. Úplný přehled všech změn a oprav je k dispozici v příslušném repozitáři na serveru GitHub, odkud je také možné stáhnout zdrojové kódy aplikace.

Verze 0.18.0

Datum zveřejnění: 7. 02. 2024

Uživatelské změny:

  • nový modul „Analýza klíčových slov“
  • zob­ra­zo­vání pře­kla­do­vých ekvi­va­lentů v pa­ra­lel­ních kor­pusech po klik­nutí na vy­brané slovo přímo v kon­ko­ranci (nový plug-in tokens_linking)
  • možnost stažení seznamu dokumentů vyhovujících vybraným typům textů
  • JSONL jako nový volitelný formát ukládání výsledků (konkordance, seznam slov, kolokace, frekvence, seznam dokumentů), kde je na každém řádku dokumentu samostatný JSON řetězec – formát je vhodný zejména pro další strojové zpracování dat
  • vylepšení odkazování z externích aplikací do KonTextu
    • vícekrokové operace (např. dotaz + filtr) s možností následné editace ve formulářích dotazů
    • podpora pro jiné než tokenové rozsahy filtrů při odkazování do KonTextu (např. „od -1s do 1s“)
  • modul „Federated Content Search“ podporuje hledání ve více korpusech najednou

Technické změny:

  • zrušení podpory pro Celery v roli výpočetního backendu (zůstává Rq)
  • nový interní HTTP klient pro dotazování externích zdrojů dat (autentizace, překladové ekvivalenty apod.)
  • vylepšený instalační skript
  • KonText používá (volitelně) vlastní modifikaci Manatee-open s větším množstvím statistických měr pro analýzu klíčových slov

Verze 0.17.0

Datum zveřejnění: 17. 02. 2023

Uživatelské změny:

  • přepracovaný systém subkorpusů
    • implicitně je každý subkorpus dostupný ostatním uživatelů - tj. není problém s prohlížením sdílených URL s výsledky.
    • pokud uživatel nevyplní popis, subkorpus není dohledatelný.
    • subkorpus je možno archivovat - URL adresy zůstanou funkční, autorovi se subkorpus nebude zobrazovat ve výpisu (lze zobrazit změnou parametru filtru).
    • na stránce konkordančního dotazu si lze aktuální výběr typů textů uložit jako koncept subkorpusu a později ho dokončit.
    • subkorpus je snadné zkopírovat či vytvořit jeho variantu dalším výběrem textů.
  • funkce disperze - grafické znázornění počtů výskytů hledaného výrazu na ose představující celý korpus tak, jak jdou slova a dokumenty ve vertikále za sebou
  • zvýraznění překladových ekvivalentů - na stránce příslušné konkordance je možné zvýraznit slova odpovídající překladům nalezeným přes Treq
  • odkaz sdílet tabulku frekv. distribuce
    • obsahuje-li stránka frekvenční distribuce více tabulek (grafů), je možné získat ke každé z nich URL odkaz pro případné sdílení či publikaci
  • výběr konkord. řádků - funkce přejít na stránku prvního vybraného řádku
    • v případě, že si uživatel kategorizuje konkordanční řádky a příslušný výběr začíná až někde daleko za první stránkou, lze se dostat na začátek výběru pomocí této nové funkce
  • možnost přidávat do KonTextu specifické zpětné odkazy (tato funkce je dostupná pro snazší integraci s ostatními aplikacemi)
  • detekce příliš časově náročných dotazů s možností přenesení takových dotazu do doporučeného menšího korpusu

Technické změny:

  • změna frameworku a webserveru z Gunicorn+Werkzeug na Sanic)
  • upgrade na React 18
  • přepis serverového backendu do asychronních funkcí (async+await)
  • výchozí použití WebSockets pro kontrolu úloh běžících na pozadí (vytváření některých subkorpusů, větší konkordance)
  • podpora Manatee 2.2xx
  • vylepšení cachování výsledků frekvenčních distribucí pro rychlejší pohyb po stránkách s výsledky
  • přechod od HTTP sessions na JWT
  • možnost aplikovat individuální „cutoff“ na velikost konkordance

Verze 0.16.0

Datum zveřejnění: 23. 02. 2022

Uživatelské změny:

  • nový typ dotazu: paradigmatický dotaz
  • vylepšený typ dotazu „seznam slov“
    • lepší provedení rozhraní formuláře
    • optimalizace ukládání výsledků pro rychlejší přístup a stránkování
  • historie dotazů podporuje všechny typy dotazování (konkordance, seznam slov, paradigmatický dotaz)
  • vylepšení frekvenční distribuce
    • grafický režim zobrazení frekvenčních distribucí
      • speciální podpora pro časové informace
    • zobrazení konfidenčních intervalů
    • možnost nastavit si výchozí druh zobrazení (tabulky vs. grafy)
  • vylepšený přehrávač audia
    • možnost posunu přehrávání v čase
    • zobrazení průběhu (waveform)
  • možnost vytvořit subkorpus přímo na stránce konkordančního dotazu
  • našeptávač s podporou sublemmat (syn2020, syn_v9) a rychlejší odezvou

Technické změny:

  • integrace řady modulů (např. „liveattrs“, historie dotazů) s databázovým systémem ČNK
  • reorganizace a modernizace serverového kódu
  • přechod od CSS souborů ke Styled Components
  • podpora pro Docker
  • podpora pro automatické testování uživatelského rozhraní
  • odstranění nepotřebných atributů z konfigurace

Verze 0.15.0

Datum zveřejnění: 18. 12. 2020

Uživatelské změny:

  • změna typů dotazu na dva:
    • pokročilý (stejné funkce jako původní CQL)
    • jednoduchý
      • víceslovné hledání
      • volitelné regulární výrazy
      • volitelné výchozí atributy (v závislosti na korpusu)
  • nový prvek pro výběr časového intervalu v „Omezení hledání“ založený na klikacím kalendáři
  • rozšíření plug-inu syntax_viewer - podpora nových vlastností v SYN2020
  • nový plug-in query_suggest poskytující nápovědu k aktuálně zapsanému dotazu
  • možnost použít plug-in token_connect jako altenativní zobrazení detailu KWIC
    • přidán modul „formátovaný text“
  • plug-in taghelper nyní podporuje i tagsety „klíč - hodnota“ a je možno též nastavit více tagsetů pro jeden korpus
  • nový způsob zobrazení dalších pozičních atributů - pod jednotlivá slova hlavního atributu
  • možnost nastavit jako hlavní atribut zobrazení libovolný poziční atribut
  • přehlednější modul „korpusová nastavení“
  • přepracované rozhraní dotazovacího formuláře v sekci „specifikovat kontext“
  • možnost provádět časově náročnější hledání (mld. korpusy, zarovnané korpusy s hledáním v jednom jazyce) bez časového omezení daného webovým serverem
  • možnost otevřít archivovanou URL adresu s výsledkem frekv. distribuce či kolokace spočtené nad většími konkordancemi, jejichž opětovné vytvoření by trvalo déle, než umožňuje limit pro běžnou interakci s KonTextem

Technické změny:

  • přepis serverové části do Python 3
  • podpora nového backendu Rq pro zpracování úloh na pozadí a jeho nasazení jako výchozího řešení
  • přepis klientské části do stejného frameworku, jaký používá aplikace WaG
  • přepis synchronizace webového serveru a výpočetního backendu při vytváření konkordancí
  • změny v HTTP API

Verze 0.13.0

Datum zveřejnění: 9. 12. 2019

  • přepis HTML šablon do systému Jinja2
  • přechod na framework React.JS, což se projevilo především rozsáhlými změnami v kódu a v menší míře také v uživatelských prvcích (např. nový vzhled korpusových nastavení zobrazení)
  • příprava na nasazení budoucí funkcionality

Verze 0.12.0

Datum zveřejnění: 30. 10. 2018

  • zobrazování překladových ekvivalentů z Trequ přímo v KonTextu při vyhledávání v paralelních korpusech (nastaveno pro InterCorp v10 a v11)
  • CQL editor s barevným zvýrazněním syntaxe a kontrolou názvů atributů a struktur
  • zjednodušení režimů zobrazení pozičních atributů (v textu, mouseover, kombinované)
  • možnost zveřejnit subkorpus spolu s jeho popisem
  • filtr - nové funkce
    • odstranit vnořené shody
    • první výskyty v dokumentu
  • přehlednější proces stahování výsledků do souboru
  • klávesové zkratky na stránce konkordance
  • možnost minimalizovat výpisy typů textu na stránce vytváření subkorpusu

Verze 0.11.0

Datum zveřejnění: 15. 12. 2017

  • 2-rozměrná frekvenční distribuce s intervalovými odhady skutečných hodnot (konfidenční intervaly), včetně exportu dat do Excelu
  • vylepšený interaktivní výběr textů - jednotlivé kroky výběru lze vracet zpět (undo)
  • vylepšená funkce interaktivního vytváření pozičních tagů - jednotlivé kroky výběru lze vracet zpět (undo)
  • vylepšená historie dotazů
    • vybrané položky je možné pojmenovat a trvale uložit
    • ukládá se kompletní stav formuláře (tedy např. i vybrané typy textů)
  • dopočítání i.p.m na vyžádání nyní funguje jen v dobře definovaných situacích (výběr textů pomocí checkboxů, ne vlastním CQL dotazem)
  • graf podílů ručně definovaných kategorií konkordančních řádků lze exportovat do Excelu
  • seznam slov:
    • nahraný black/white-list je nyní možno dále upravit přímo v prohlížeči
    • na stránce s výsledky se lze na jedno kliknutí dostat na poslední stránku
  • možnost skrýt jednotlivé jazyky v konkordanci paralelních korpusů

Verze 0.10.0

Datum zveřejnění: 11. 4. 2017

  • u mluvených korpusů možnost zobrazení detailu konkordance ve formě dialogu s vyznačením mluvčích i jejich překryvů a s přehráváním po kliknutí na ikonku reproduktoru
  • možnost namixovat si vlastní poměry typů textu při vytváření subkorpusu
  • jednotlivé kroky práce s konkordancí v rámci drobečkové navigace jsou editovatelné, lze se tedy vracet ke starším operacím a měnit jejich parametry
  • přepnutí korpusu v úvodním formuláři nyní zachová dotaz, typ dotazu a rozlišování velikosti písmen
  • označené konkordanční řádky (v rámci třídění do skupin pomocí čísel) jsou nově barevně odlišené
  • hlavičky webových stránek nyní obsahují informaci o dotazu (využití u záložek a pro lepší orientaci v historii prohlížeče)

Verze 0.9.0

Datum zveřejnění: 26. 9. 2016

  • podpora zobrazování syntaktických struktur
  • asynchronní vytváření subkorpusu, u paralelních korpusů navíc s možností vzít v úvahu (ne)existenci zarovnání
  • při vytváření subkorpusu a specifikaci metainformací přidán „našeptávač“ možných hodnot daného atributu, jestliže jich pro zobrazení zůstává příliš mnoho
  • zobrazování pozičních atributů v konkordanci při přejetí myší (tzv. mouse-over)
  • přechod mezi stránkami konkordance bez opětovného načítání stránky
  • ukládání výsledků frekvenční distribuce a kolokační analýzy do cache pro rychlejší přesun mezi stránkami
  • podpora pro přejmenovávání a mazání skupin konkordančních řádek
  • podpora zobrazování čísel řádků v konkordanci

Verze 0.8.0

Datum zveřejnění: 8. 3. 2016

  • podpora pro manualní rozřazování konkordančních řádek do skupin (označených čísly)
  • výpočet i.p.m. u subkorpusů (na kliknutí; předchozí verze počítaly i.p.m. z celého korpusu, což mohlo být matoucí)
  • subkorpus lze vytvořit pomocí podmínek na různé struktury (např. <speaker sex="male" /> a <session id="foo.+" />)
  • drobečková navigace ukazující postup při práci na dotazu

Verze 0.7.0

Datum zveřejnění: 5. 10. 2015

  • nová komponenta pro výběr korpusu obsahující mj. oblíbené a vlajkové korpusy
  • přepracované menu Nastavení
  • zjednodušení uživatelské práce s rozhraním (např. přidání zarovnaného korpusu)