一、理论
什么是混淆矩阵?其实就是把所有类别的预测结果与真实结果按类别放置到了同一个表里,在这个表里我们可以清楚地看到每个类别正确识别的数量和错误识别的数量。
混淆矩阵在什么情况下最好呢?答案是类别不平衡时。
混淆矩阵是除了ROC曲线和AUC之外的另一个判别分类好坏程度的方法。
TP=True Positive=真阳性(真实为0,预测为0,即将正类预测为正类)
FP=False Positive=假阳性(真实为1,预测为0,即将负类预测为正类)
FN=False Negative=假阴性(真实为0,预测为1,即将正类预测为负类)
TN=True Negative=真阴性(真实为1,预测为1,即将负类预测为负类)
针对二分类来说,混淆矩阵为
预测值=0 | 预测值=1 | |
真实值=0 | TN | FP |
真实值=1 | FN |