- 深度学习初学者指南
- (智)巴勃罗·里瓦斯
- 613字
- 2021-12-01 13:58:59
4.2.3 回归分析矩阵
目前最流行的度量指标是均方误差(MSE),我们在前面介绍线性回归的工作原理时已经讨论过它。然而,将它解释为超参数选择的函数。在这里,我们在一般意义上重新定义MSE:
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/087-3-i.jpg?sign=1739699943-Ue6TxhcavOzlY2h0fG5VVFHfnHw1Id8f-0-450f1c5693be1a098b5092befc32aa79)
另一个与MSE非常相似的度量指标是平均绝对误差(MAE)。MSE对大错误的惩罚更多(二次幂),对小错误的惩罚更少,而MAE对所有错误的惩罚都与真值与预测值之间的误差绝对值成正比。MAE的正式定义如下:
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/087-4-i.jpg?sign=1739699943-BRDFPzRiPEvZHK8woBKnGwQ2VQnui70t-0-d71cbdbfc0c898dae4be32ca992058b4)
最后,对于回归分析的其他度量指标,深度学习中最为流行的是得分,也称为决定系数。这个度量指标表示方差的比例,可以使用模型中的自变量来解释。它衡量模型在与训练数据遵循相同统计分布的不可见数据上良好表现的可能性。决定系数的定义如下:
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/087-6-i.jpg?sign=1739699943-OfuKNMwmo1OigVyPht2utEkAMXKY3NC1-0-3ce4b65aad1d68f85464283a4fd9d830)
其中样本均值的定义如下:
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/087-8-i.jpg?sign=1739699943-79bEb5LDo3b6i6mH8w7370nK2KUQ8yl4-0-047383d3382e105adb2f4035e6ca9ac9)
scikit-learn对这些指标中都有相应的类可用,如下表所示:
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/087-9-i.jpg?sign=1739699943-YtMrTTrnusz53KOMDIin4CdheAoLpZAG-0-e59bd32b91f9cfe3f1d1ce35dc4cc755)
所有这些类都使用真实标签和预测标签作为输入参数。
例如,以图4.3和图4.4所示的数据和线性回归模型作为输入,可以确定三个误差度量指标,具体做法如下:
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/088-i.jpg?sign=1739699943-HXsndOgKHquI1tK1vS6HPiaWYxGnmE0f-0-1ce054e7def874403f6846f60e1c2396)
上述代码的输出结果如下:
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/088-2-i.jpg?sign=1739699943-t8I7qtrqTQ9y6ciKH8w2GMNYZvp0UFwm-0-bf71dfefb4b816412f86ace161c2df90)
图4.9表示用于回归分析的样本数据及预测效果。显然,这三个误差度量指标的度量效果都比较好。
![](https://epubservercos.yuewen.com/696A86/21821546001993006/epubprivate/OEBPS/Images/4a9.jpg?sign=1739699943-TcUzPcplOF8Xjv9zNY3QeVLDw2CyT0rv-0-c228ae08d7183e074fc13810d5b2cca7)
图4.9 白噪声污染数据的线性回归模型误差度量
一般来说,你总是希望有一个尽可能接近1的决定系数,并且所有的误差(MSE和MAE)尽可能接近0。但是,虽然所有这些都是报告模型预测性能的良好度量标准,但是我们必须十分小心地在不可见验证或测试数据上给出这些度量标准。这样就可以准确地测量模型的泛化能力,并在它成为灾难性错误之前识别出模型中的过拟合现象。