深度学习:mAP(meanaverageprecision)
mAP是指平均准确率,是机器学习中模型好坏的⼀种评价指标。在介绍mAP前应该⾸先了解⼏个概念:
1、P (percision)      准确率,在周志华的《机器学习》中,称为“查准率”。在信息检索中,准确率是指我检索出的信息有多少⽐例是⽤户感兴趣的。
  P = 系统检索到的相关⽂件 / 系统检索到的⽂件总数
2、R (recall)          召回率,⼜称为“查全率”,指⽤户感兴趣的信息有多少被检测出来了
  R = 系统检测到的相关⽂件 / 数据库中相关⽂件总数
举个例⼦来说,某数据库中有1000个⽂件,我要搜索跟机器学习相关的⽂件,⽽数据库中机器学习相关⽂件有200个。搜索后,系统检索出100个⽂件,80个跟机器学习相关,那么:
  P(准确率) = 80 / 100 = 80%
R(召回率)= 80 / 200 = 40%
在改变检索算法后,再进⾏⼀次检索,结果检索出180个⽂件,机器学习相关⽂件有120个,那么:
  P(准确率)= 120 / 180 = 66.7%
  R(召回率)= 120 / 200 = 60%
这两个算法到底哪个算法好呢,很难单⼀的⽤准确率或召回率来评判。
准确率和召回率⼀般有如下特点:准确率⾼,召回率就低。召回率⾼,准确率就低。这个也⽐较容易理解,⽐如要获得较⾼的召回率,势必要搜索出⼤量⽂件,还是上⾯那个例⼦,我搜索出500个⽂件,其中200个跟机器学习相关,那么召回率为100%,但是准确率只有40%。当然,如果算法能做到准确率和召回率都⾼,那是最好。
那么如何结合准确率和召回率对模型进⾏评判呢,可以使⽤F度量
3、F度量(F-measure)
  F度量涵盖了准确率和召回率这两个指标。其计算公式如下:
  F = 2 * P * R / (P + R)
  结合以上两个例⼦,第⼀个例⼦的F度量为0.53,第⼆个例⼦的F度量为0.63
数据库学什么接下来进⼊主题,mAP是什么呢?
前⾯介绍了准确率和召回率单独来评价模型不科学,结合这两个指标的话可以⽤F度量,其实还有⼀种⽅法,即Average Precision(平均精度AP)——以召回率和准确率为⾏纵坐标,得到⼆维曲线,即PR曲线。将PR曲线下的⾯积当作衡量尺度,得到AP值。
mAP即平均AP值,是对多个验证集求平均AP值,其中Q R指验证集个数
reference: