机器学习编程:从编码到深度学习
上QQ阅读APP看书,第一时间看更新

5.4 小结

我们在本章讨论了二元分类问题,这是一种面向二元标签样本数据的学习和预测问题。传统的线性回归模型不能很好地处理分类问题,所以我们引入了一种新的算法,即分类算法来处理分类问题。

分类算法基于一个名为逻辑函数或S型函数的一种特殊函数。在模型训练阶段,我们使用S型函数将任何范围内的取值压缩至0~1之间。在模型预测阶段,我们将S型函数值裁剪为与其较近的二进制值(0或1),以输出一个明确的分类类型。

在线性回归模型中,我们使用均方误差来计算损失值。但是,如果在公式中添加了S型函数,那么均方误差函数的表面就会变得凹凸不平,不利于使用梯度下降算法计算模型的参数。因此,我们切换到另外一个损失函数,它叫作log损失函数。这个损失函数与S型函数配合得很好。

下一章将是一个突破。既然我们已经掌握了分类模型,下面就把这个分类模型应用到一个令人兴奋的实际问题上,那就是图像识别。面对这样的问题,我们的小型程序还能正常工作吗?