[二分类]混淆矩阵

混淆矩阵(confusion matrix)是分类任务中最常见的特性,通过矩阵形式展示预测类别和真实类别的差异

本文学习二分类下的混淆矩阵

正样本和负样本

将包含指定类别的图像称为正样本(positive case),不包含指定类别的图像称为负样本(negative case

混淆矩阵

混淆矩阵是一个两行两列的表格,其结构如下:

Actual class
true false
Predicted class positive true positive(TP) false positive(FP) 预测正样本个数=TP+FP
negative false negative(FN) true negative(TN) 预测负样本个数=FN+TN
实际正样本个数=TP+FN 实际负样本个数=FP+TN

对数据进行检测,能够得到以下4种检测结果

  • 预测结果是正样本
    • 实际是正样本,称为真阳性(true positive,简称TP
    • 实际是负样本,称为假阳性(false positive, 简称FP
  • 预测结果是负样本
    • 实际是正样本,称为假阴性(false negative,简称FN
    • 实际是负样本,称为真阴性(true negative, 简称TN

也就是说,根据预测情况决定预测结果是阳性还是阴性;根据实际结果决定预测结果是真还是假

相关阅读

wikisklearn手册上均拥有相关描述,内容是一致的,注意具体描述即可