模型评估与选择,理解AUC和ROC
前言
我总是觉得,光看书很难理解知识,因为人们在写书时似乎总是把知识写得很官方,全然不讲那些知识是如何被想出来的。
AUC
从咱们的定义上来说,这就是一条真正例率(TPR)和假正例率(FPR)的关系曲线。
至于这条线是怎么画出来的,就是通过不停的调整分类阈值,然后计算出每个阈值下的TPR和FPF。
所以其实在我眼里,y轴也可以被替换为分类阈值。
也就是说这本质上可以理解为一条假正例率关于分类阈值的变化曲线。
所以 AUC 的本质作用就是用来寻找合适的分类阈值。
那自然我们也可以根据我们的实际需要,比如真负例率(TNR)更重要,那么我们就可以画出另一条 ”AUC“(到时候就不叫这个名字了),来帮助我们挑选合适的分类阈值。
ROC
ROC 呢其实没太多需要解释的,看书就行了。
被包裹了自然就说明另一个模型更好,毕竟假正例率一样的时候,真正例率更高的模型自然更好。
但是要是说面积更大的模型更好,那我就不敢苟同了,毕竟你模型提交上去的时候阈值就定下来了。
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.