Toto je starší verze dokumentu!
Precision a recall
Oba pojmy - precision i recall - jsou původně převzaty z informatiky a je možné je přeložit jako přesnost a výtěžnost pokrytí zkoumaných dat daným přístupem. Využívají se zejména při hodnocení úspěšnosti automatických nástrojů na analýzu textu (např. taggerů).
Precision
Míra precision je definována jako procentuální poměr relevantních výsledků analýzy ke všem výsledkům analýzou získaným.
Recall
Na rozdíl od precision je recall poměr relevantních výsledků analýzy ke všem relevantním výsledkům ve zkoumaném vzorku bez ohledu na to, zda byly analýzou identifikovány.
Příklady
Pokud bychom se např. snažili v korpusu vyhledat všechny výskyty slov patřících k paradigmatu stavení pouze pomocí dotazu, který nachází pouze tvary končící na -í, bez jakékoliv další specifikace, byla by míra precision snížena (z maximálních 100 %) tím, že by se ve výsledku objevovaly i formy z jiných paradigmat (paní, mladí, trpí apod.). Míra recall by byla nižší (než maximálních 100 %) v důsledku absence tvarů stavením, náměstími apod., které dotaz nepodchytil, avšak do výsledku měly být podle zadání započítány.