《机器学习技法》—核型逻辑回归

我们知道，soft-SVM的一般形式是：

这里我们把松弛变量ξn写成下面的形式（这里其实就是松弛变量的定义，如果这个点不违反硬条件，则它的松弛变量为0，否则的话，松弛变量的值就是它到底违反了多少，即yn(w*xn + b)与1的差值）:

这样写之后，原问题的约束条件已经被包含进来了。因此原问题变为下面的无约束形式：

2 soft-SVM与逻辑回归的联系

我们用另一种方式看待上面的无约束形式：第一项是正则项，第二项是替代01错误的一个errhat。我们把01错误和这个errhat画在图上，可以发现：

这个errhat是01错误的上界，所以我们只要做好这个errhat，也就间接做好了01错误。

我们再把逻辑回归的errhat加进来：

黄色的线是逻辑回归的err。可以发现，它和svm的err是很接近的！

结论：

加L2正则的逻辑回归，很近似的相当于soft-SVM。

由于SVM和逻辑回归的相似性，因此我们可以用如下两层学习的方式，先学一个SVM模型，然后把这个模型的打分用最大似然的原则的微调：

得到的混合模型就可以用来输出概率。

加L2正则的逻辑回归，可以用核函数来做。下面我们做一番推导。

首先介绍一个定理，Representer Theorem：

即：对于加了L2正则，并且err是wz的函数的问题，最优的w一定是z的线性组合。

证明如下：

因此，对于加L2正则的逻辑回归来说，就有：

代入最优的w形式，并把z的乘积用核函数表示：

我们的KLR既可以看作是z空间上的一个线性模型，也可以看作是核函数对原始特征变换后产生新特征的一个线性模型。

KLR的形式是：

经核函数变换得到的新特征是：

右边这一项就是在新特征上的一个线性模型，左边这一项可以看作一个正则项：

因此KLR既可以看作是w的一个线性模型，也可以看作是β的一个线性模型：

展开阅读全文