机器学习入门04

发表于 2025-02-18 分类于机器学习阅读次数：本文字数： 1.8k 阅读时长 ≈ 3 分钟

今天继续进行机器学习的入门，主题是逻辑回归。

逻辑回归 (Logistic Regression)

逻辑回归模型旨在预测给定结果的概率。许多问题需要将概率估算值(Probability Estimation)作为输出，逻辑回归是一种极其高效的概率计算机制。

Sigmoid函数(也称为S型函数, S-shaped Function)是逻辑回归中的核心函数，其数学表达式为：

\[ f(x) = \frac{1}{1 + e^{-x}} \]

Sigmoid函数具有以下重要特征(Features)：

逻辑回归模型首先计算线性组合(Linear Combination)：

\[ z = b + w_1x_1 + w_2x_2 + ... + w_Nx_N \]

其中：

要获得逻辑回归的预测结果，需要将 z 值传递给Sigmoid函数，将得到一个介于0到1之间的值（概率, Probability）：

\[ y' = \frac{1}{1 + e^{-z}} \]

其中：

逻辑回归模型的训练过程与线性回归两个关键区别：

逻辑回归模型的训练过程与线性回归有两个关键区别：

在线性回归中，我们使用平方损失函数(L2 Loss Function)作为损失函数。但对于逻辑回归，平方损失函数并不适合，原因如下：

如果使用平方损失来计算Sigmoid函数的误差，当输出接近0和1时，需要更多的精度位数来保留这些差异。

对数损失函数(Log Loss Function)通过对数形式来返回变化梯度的对数，而不仅是从数值到预测的距离。其计算公式为：

\[ \text{Log Loss} = \sum_{(x,y) \in D} -y\log(y') - (1-y)\log(1-y') \]

其中：

正则化(Regularization)是用来降低模型复杂度的技术。在逻辑回归研究中，如果没有正则化，逻辑回归的渐近性质会导致全局损失接近0，容易造成过拟合(Overfitting)。

L2正则化 (L2 Regularization)
- 也称为权重衰减(Weight Decay)
- 通过在损失函数中添加所有特征权重的平方和来实现
- 倾向于让权重变得更小，但不会变成0
早停法 (Early Stopping)
- 通过限制训练步数来控制模型复杂度
- 在损失曲线趋于平缓时停止训练
- 可以防止模型过度拟合训练数据
- 需要使用验证集来确定最佳停止时机

以上是逻辑回归的基础内容，后续的内容请看下一篇博客。