Jednou ze stěžejních vlastností rozhraní KonText je možnost identifikovat pomocí statistických metod kolokace k vyhledanému slovu. Kolokací se přitom rozumí smysluplné, ustálené, syntagmatické spojení dvou (nebo víc) slov v blízkém kontextu. Kolokace je tvořena základovým slovem (node, většinou se jedná o KWIC) a kontextovým slovem (kolokátem). Seznam kolokátů, s kterými se hledané slovo nebo slovní spojení pojí, je základem korpusové analýzy, protože umožňuje vysledovat, jaký kontext je pro hledaný jev typický.
Pro identifikaci kolokací se používají asociační míry, v současnosti se v rozhraní KonText využívá těchto 8 základních: t-score, MI, MI3, log likelihood, min. citlivost, logDice, MI.log_f a relativní frekvence. Každá z měr je citlivá na jiný typ slovního spojení a každá v některých případech selhává, je proto obecně doporučeníhodné míry kombinovat a porovnávat jejich výstupy. Výsledkem statistické analýzy pomocí asociačních měr je seznam kolokačních kandidátů, o jejichž skutečné kolokační platnosti musí rozhodnout až badatel.
Poznámka: Při počítání kolokací se vzhledem k omezení manažeru Manatee nebere ohled na struktury, tzn. základové a kontextové slovo mohou být i v různých větách. Když se v jednom kontextovém okně vyskytne více stejných slov, počítá se jejich spojení se základovým slovem jen jednou.
Předpokládejme, že jsme v korpusu SYN2015 vytvořili konkordanci lemmatu dřevo. Po kliknutí na položku Kolokace → Vlastní (lze využít též klávesovou zkratku Shift + C) v menu se zobrazí zadávací formulář kolokační analýzy. V něm je možné specifikovat následující hodnoty hledání kolokací v rámci vytvořené konkordance:
Při setřídění výpisu podle logDice od njevyšší hodnoty se jako nejvýznamnější kolokační kandidáti ukazují tyto tvary: masivního, tvrdého, kus, kovu, tmavého, dubového…
V seznamu najdeme pro každou jednotku jednak celkovou frekvenci souvýskytu vyhledaného jevu a jeho kolokátu (např. lemmatu dřevo a kolokátu tvrdého) a jednak hodnoty vybraných asociačních měr pro takovéto spojení. Při kliknutí na záhlaví tabulky je možné seznam přetřídit podle zvolené veličiny. Stejně jako ve výpisu frekvenční distribuce je i v seznamu kolokátů možné pomocí odkazů p/n vytvořit pozitivní nebo negativní filtr, který hledá kolokát v okolí původního KWICu.