检测技术中的主要评价指标,评测结果检测的常见指标有哪些

首页 > 上门服务 > 作者:YD1662023-10-31 01:46:55

检测技术中的主要评价指标,评测结果检测的常见指标有哪些(1)

你被珍藏过,也被放弃过,被反复观看,也被寻觅,被一眼掠过,也被视而不见,可这都与你无关。你好或者不好,关乎望过来的人和眼,那评价来自他的世界,你只需完成你确认的自己。

检测技术中的主要评价指标,评测结果检测的常见指标有哪些(2)

接下来将介绍一些常用的模型评估指标,这些衡量指标不限于目标检测模型的评估,包括:混淆矩阵、准确率、精确率、召回率和PR曲线、AP、mAP、ROC、AUC。

混淆矩阵

混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。混淆矩阵是以模型预测的类别数量统计信息为横轴,真实标签的数量统计信息为纵轴画出的矩阵,如图1所示。

检测技术中的主要评价指标,评测结果检测的常见指标有哪些(3)

图1 混淆矩阵

对角线代表了模型预测和数据标签一致的数目,所以准确率也可以用混淆矩阵对角线之和除以测试集图片数量来计算。对角线上的数字越大越好,代表模型在该类的预测结果更好。其他地方自然是预测错误的地方,自然值越小说明模型预测的更好。

准确率、精确率、召回率和PR曲线

周志华老师在《机器学习》一书中的‘性能评估’章节中的很形象的说法:准确率又称查准率,召回率又称查全率。一个经典例子是存在一个测试集合,测试集合只有大雁和飞机两种图片组成,假设你的分类系统最终的目的是:能取出测试集中所有飞机的图片,而不是大雁的图片。然后就可以定义:

- True positives: 简称为TP,即正样本被正确识别为正样本,飞机的图片被正确的识别成了飞机。

- True negatives: 简称为TN,即负样本被正确识别为负样本,大雁的图片没有被识别出来,系统正确地认为它们是大雁。

-False Positives: 简称为FP,即负样本被错误识别为正样本,大雁的图片被错误地识别成了飞机。

- False negatives: 简称为FN,即正样本被错误识别为负样本,飞机的图片没有被识别出来,系统错误地认为它们是大雁。

召回率(recall)是测试集中所有正样本样例中,被正确识别为正样本的比例。也就是本假设中,被正确识别出来的飞机个数与测试集中所有真实飞机的个数的比值,公式表示为:TP/(TP FN)。

精确率(Precision)就是在识别出来的图片中,True positives所占的比率。也就是本假设中,所有被识别出来的飞机中,真正的飞机所占的比例,公式表示为:TP/(TP FP)=TP/N,其中N代表测试集样本数。

准确率(Accuracy)是检测时预测对的样本数除以所有的样本数,公式表示为: (TP TN)/(TP FN FP TN)。准确率一般被用来评估检测模型的全局准确程度,包含的信息有限,不能完全评价一个模型的性能。

所谓PR曲线就是改变识别阈值,使得系统依次能够识别前K张图片,阈值的变化同时会导致Precision与Recall值发生变化,从而得到曲线。曲线图如图2所示。

检测技术中的主要评价指标,评测结果检测的常见指标有哪些(4)

首页 12下一页

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.