Přehled verzí rozhraní KonText
Korpusový manažer KonText slouží pro všeobecnou práci s korpusy ČNK. Popis funkcí rozhraní KonText je dostupný v manuálu, podrobnější návod, jak využívat všech jeho možností najdete v kurzu práce s ČNK.
KonText je rozšířenou a graficky upravenou verzí původní aplikace NoSketch Engine, vyvíjenou v ÚČNK FF UK a na ÚFAL MFF UK pod licencí GNU GPL 2 (hlavními vývojáři jsou Tomáš Machálek a Martin Zimandl). Stejně jako NoSketch Engine používá i KonText jako výpočetní server program Manatee.
V tomto přehledu verzí vývoje KonTextu uvádíme pouze zásadnější změny, které můžou být zajímavé pro koncového uživatele. Úplný přehled všech změn a oprav je k dispozici v příslušném repozitáři na serveru GitHub, odkud je také možné stáhnout zdrojové kódy aplikace.
Verze 0.18.0
Datum zveřejnění: 7. 02. 2024
Uživatelské změny:
- nový modul „Analýza klíčových slov“
- zobrazování překladových ekvivalentů v paralelních korpusech po kliknutí na vybrané slovo přímo v konkoranci (nový plug-in
tokens_linking
) - možnost stažení seznamu dokumentů vyhovujících vybraným typům textů
- JSONL jako nový volitelný formát ukládání výsledků (konkordance, seznam slov, kolokace, frekvence, seznam dokumentů), kde je na každém řádku dokumentu samostatný JSON řetězec – formát je vhodný zejména pro další strojové zpracování dat
- vylepšení odkazování z externích aplikací do KonTextu
- vícekrokové operace (např. dotaz + filtr) s možností následné editace ve formulářích dotazů
- podpora pro jiné než tokenové rozsahy filtrů při odkazování do KonTextu (např. „od
-1s
do1s
“)
- modul „Federated Content Search“ podporuje hledání ve více korpusech najednou
Technické změny:
- zrušení podpory pro Celery v roli výpočetního backendu (zůstává Rq)
- nový interní HTTP klient pro dotazování externích zdrojů dat (autentizace, překladové ekvivalenty apod.)
- vylepšený instalační skript
- KonText používá (volitelně) vlastní modifikaci Manatee-open s větším množstvím statistických měr pro analýzu klíčových slov
Verze 0.17.0
Datum zveřejnění: 17. 02. 2023
Uživatelské změny:
- přepracovaný systém subkorpusů
- implicitně je každý subkorpus dostupný ostatním uživatelů - tj. není problém s prohlížením sdílených URL s výsledky.
- pokud uživatel nevyplní popis, subkorpus není dohledatelný.
- subkorpus je možno archivovat - URL adresy zůstanou funkční, autorovi se subkorpus nebude zobrazovat ve výpisu (lze zobrazit změnou parametru filtru).
- na stránce konkordančního dotazu si lze aktuální výběr typů textů uložit jako koncept subkorpusu a později ho dokončit.
- subkorpus je snadné zkopírovat či vytvořit jeho variantu dalším výběrem textů.
- funkce disperze - grafické znázornění počtů výskytů hledaného výrazu na ose představující celý korpus tak, jak jdou slova a dokumenty ve vertikále za sebou
- zvýraznění překladových ekvivalentů - na stránce příslušné paralelní konkordance je možné zvýraznit slova odpovídající překladům nalezeným přes Treq
- odkaz sdílet tabulku frekv. distribuce
- obsahuje-li stránka frekvenční distribuce více tabulek (grafů), je možné získat ke každé z nich URL odkaz pro případné sdílení či publikaci
- výběr konkord. řádků - funkce přejít na stránku prvního vybraného řádku
- v případě, že si uživatel kategorizuje konkordanční řádky a příslušný výběr začíná až někde daleko za první stránkou, lze se dostat na začátek výběru pomocí této nové funkce
- možnost přidávat do KonTextu specifické zpětné odkazy (tato funkce je dostupná pro snazší integraci s ostatními aplikacemi)
- detekce příliš časově náročných dotazů s možností přenesení takových dotazu do doporučeného menšího korpusu
Technické změny:
- změna frameworku a webserveru z Gunicorn+Werkzeug na Sanic)
- upgrade na React 18
- přepis serverového backendu do asychronních funkcí (
async+await
) - výchozí použití WebSockets pro kontrolu úloh běžících na pozadí (vytváření některých subkorpusů, větší konkordance)
- podpora Manatee 2.2xx
- vylepšení cachování výsledků frekvenčních distribucí pro rychlejší pohyb po stránkách s výsledky
- přechod od HTTP sessions na JWT
- možnost aplikovat individuální „cutoff“ na velikost konkordance
Verze 0.16.0
Datum zveřejnění: 23. 02. 2022
Uživatelské změny:
- nový typ dotazu: paradigmatický dotaz
- vylepšený typ dotazu „seznam slov“
- lepší provedení rozhraní formuláře
- optimalizace ukládání výsledků pro rychlejší přístup a stránkování
- historie dotazů podporuje všechny typy dotazování (konkordance, seznam slov, paradigmatický dotaz)
- vylepšení frekvenční distribuce
- grafický režim zobrazení frekvenčních distribucí
- speciální podpora pro časové informace
- zobrazení konfidenčních intervalů
- možnost nastavit si výchozí druh zobrazení (tabulky vs. grafy)
- vylepšený přehrávač audia
- možnost posunu přehrávání v čase
- zobrazení průběhu (waveform)
- možnost vytvořit subkorpus přímo na stránce konkordančního dotazu
- našeptávač s podporou sublemmat (syn2020, syn_v9) a rychlejší odezvou
Technické změny:
- integrace řady modulů (např. „liveattrs“, historie dotazů) s databázovým systémem ČNK
- reorganizace a modernizace serverového kódu
- přechod od CSS souborů ke Styled Components
- podpora pro Docker
- podpora pro automatické testování uživatelského rozhraní
- odstranění nepotřebných atributů z konfigurace
Verze 0.15.0
Datum zveřejnění: 18. 12. 2020
Uživatelské změny:
- změna typů dotazu na dva:
- pokročilý (stejné funkce jako původní CQL)
- jednoduchý
- víceslovné hledání
- volitelné regulární výrazy
- volitelné výchozí atributy (v závislosti na korpusu)
- nový prvek pro výběr časového intervalu v „Omezení hledání“ založený na klikacím kalendáři
- rozšíření plug-inu syntax_viewer - podpora nových vlastností v SYN2020
- nový plug-in query_suggest poskytující nápovědu k aktuálně zapsanému dotazu
- možnost použít plug-in token_connect jako altenativní zobrazení detailu KWIC
- přidán modul „formátovaný text“
- plug-in taghelper nyní podporuje i tagsety „klíč - hodnota“ a je možno též nastavit více tagsetů pro jeden korpus
- nový způsob zobrazení dalších pozičních atributů - pod jednotlivá slova hlavního atributu
- možnost nastavit jako hlavní atribut zobrazení libovolný poziční atribut
- přehlednější modul „korpusová nastavení“
- přepracované rozhraní dotazovacího formuláře v sekci „specifikovat kontext“
- možnost provádět časově náročnější hledání (mld. korpusy, zarovnané korpusy s hledáním v jednom jazyce) bez časového omezení daného webovým serverem
- možnost otevřít archivovanou URL adresu s výsledkem frekv. distribuce či kolokace spočtené nad většími konkordancemi, jejichž opětovné vytvoření by trvalo déle, než umožňuje limit pro běžnou interakci s KonTextem
Technické změny:
- přepis serverové části do Python 3
- podpora nového backendu Rq pro zpracování úloh na pozadí a jeho nasazení jako výchozího řešení
- přepis klientské části do stejného frameworku, jaký používá aplikace WaG
- přepis synchronizace webového serveru a výpočetního backendu při vytváření konkordancí
- změny v HTTP API
Verze 0.13.0
Datum zveřejnění: 9. 12. 2019
- přepis HTML šablon do systému Jinja2
- přechod na framework React.JS, což se projevilo především rozsáhlými změnami v kódu a v menší míře také v uživatelských prvcích (např. nový vzhled korpusových nastavení zobrazení)
- příprava na nasazení budoucí funkcionality
Verze 0.12.0
Datum zveřejnění: 30. 10. 2018
- zobrazování překladových ekvivalentů z Trequ přímo v KonTextu při vyhledávání v paralelních korpusech (nastaveno pro InterCorp v10 a v11)
- CQL editor s barevným zvýrazněním syntaxe a kontrolou názvů atributů a struktur
- zjednodušení režimů zobrazení pozičních atributů (v textu, mouseover, kombinované)
- možnost zveřejnit subkorpus spolu s jeho popisem
- filtr - nové funkce
- odstranit vnořené shody
- první výskyty v dokumentu
- přehlednější proces stahování výsledků do souboru
- klávesové zkratky na stránce konkordance
- možnost minimalizovat výpisy typů textu na stránce vytváření subkorpusu
Verze 0.11.0
Datum zveřejnění: 15. 12. 2017
- 2-rozměrná frekvenční distribuce s intervalovými odhady skutečných hodnot (konfidenční intervaly), včetně exportu dat do Excelu
- vylepšený interaktivní výběr textů - jednotlivé kroky výběru lze vracet zpět (undo)
- vylepšená funkce interaktivního vytváření pozičních tagů - jednotlivé kroky výběru lze vracet zpět (undo)
- vylepšená historie dotazů
- vybrané položky je možné pojmenovat a trvale uložit
- ukládá se kompletní stav formuláře (tedy např. i vybrané typy textů)
- dopočítání i.p.m na vyžádání nyní funguje jen v dobře definovaných situacích (výběr textů pomocí checkboxů, ne vlastním CQL dotazem)
- graf podílů ručně definovaných kategorií konkordančních řádků lze exportovat do Excelu
- seznam slov:
- nahraný black/white-list je nyní možno dále upravit přímo v prohlížeči
- na stránce s výsledky se lze na jedno kliknutí dostat na poslední stránku
- možnost skrýt jednotlivé jazyky v konkordanci paralelních korpusů
Verze 0.10.0
Datum zveřejnění: 11. 4. 2017
- u mluvených korpusů možnost zobrazení detailu konkordance ve formě dialogu s vyznačením mluvčích i jejich překryvů a s přehráváním po kliknutí na ikonku reproduktoru
- možnost namixovat si vlastní poměry typů textu při vytváření subkorpusu
- jednotlivé kroky práce s konkordancí v rámci drobečkové navigace jsou editovatelné, lze se tedy vracet ke starším operacím a měnit jejich parametry
- přepnutí korpusu v úvodním formuláři nyní zachová dotaz, typ dotazu a rozlišování velikosti písmen
- označené konkordanční řádky (v rámci třídění do skupin pomocí čísel) jsou nově barevně odlišené
- hlavičky webových stránek nyní obsahují informaci o dotazu (využití u záložek a pro lepší orientaci v historii prohlížeče)
Verze 0.9.0
Datum zveřejnění: 26. 9. 2016
- podpora zobrazování syntaktických struktur
- asynchronní vytváření subkorpusu, u paralelních korpusů navíc s možností vzít v úvahu (ne)existenci zarovnání
- při vytváření subkorpusu a specifikaci metainformací přidán „našeptávač“ možných hodnot daného atributu, jestliže jich pro zobrazení zůstává příliš mnoho
- zobrazování pozičních atributů v konkordanci při přejetí myší (tzv. mouse-over)
- přechod mezi stránkami konkordance bez opětovného načítání stránky
- ukládání výsledků frekvenční distribuce a kolokační analýzy do cache pro rychlejší přesun mezi stránkami
- podpora pro přejmenovávání a mazání skupin konkordančních řádek
- podpora zobrazování čísel řádků v konkordanci
Verze 0.8.0
Datum zveřejnění: 8. 3. 2016
- podpora pro manualní rozřazování konkordančních řádek do skupin (označených čísly)
- výpočet i.p.m. u subkorpusů (na kliknutí; předchozí verze počítaly i.p.m. z celého korpusu, což mohlo být matoucí)
- drobečková navigace ukazující postup při práci na dotazu
Verze 0.7.0
Datum zveřejnění: 5. 10. 2015
- nová komponenta pro výběr korpusu obsahující mj. oblíbené a vlajkové korpusy
- přepracované menu Nastavení
- zjednodušení uživatelské práce s rozhraním (např. přidání zarovnaného korpusu)