[机器学习]逻辑回归

2023-11-23

1.2k words

1.基本思想

逻辑回归是一种广义上的线性回归分析模型，简单来看就是将线性回归的结果y通过一个映射函数sigmoid映射到0-1区间，将sigmoid函数输出当做概率值，当概率值大于0.5时分类为正类，反之反类。

这里既然是定义，说明是人为规定的，原因在于这样定义对后续的推导可以起到简化作用，后文紧接着会提到。如果你比较叛逆，不这样定义也是可以的，就是推导会非常麻烦。

接下来是第二个涉及定义的地方，定义将sigmoid函数输出为概率值，sigmoid函数输出是[0,1]区间的，恰好符合概率的要求。且定义正类的概率为，负类自然就是。

综上，

则给定一些特征，其是正类的概率写作或；负类的概率写作或

关键一步的化繁为简，将分类为正类的概率 和分类为负类的概率 同时用一条公式表达出来：

$令合并令原式变换为$

非常非常巧妙是不是，自己尝试代入标签y=1或者y=0看看效果是不是和原先一模一样

现在，我们有了一个统一的公式表达标签及对应的概率：

上面将sigmoid函数输出当做概率，我们目标追求正确分类的概率要越高越好，使用最大似然估计来求使达到最大的参数，故可以得到参数的似然函数如下：