统计学习导论-支持向量机

最大边界分类器

超平面

  • p维空间里(p-1)维子空间
  • \(\beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_p X_p = 0\) 定义一个p维超平面,X落在超平面上
  • p维空间中点X不在超平面上就在其两侧

超平面分类

  • n*p矩阵X分为两类Y-1或1
  • 代入超平面大于0为1,小于0为-1,有\(Y*\beta*X > 0\) 表示分类正确
  • 构建训练函数\(f(x^*) = \beta_0 + \beta_1 X_1^* + \beta_2 X_2^* + ... + \beta_p X_p^*\) 正数表示为1,负数为-1,距离0越远表示距离超平面越远,越近表示分类越不确定,判定边界为线性

最大边界分类器

  • 最大边界超平面:距离边界最近的距离的所有超平面中距离边界点最远的那个超平面
  • 分类良好但容易在p大时过拟合
  • 形成最大边界分类器所需要的边界点为支持向量,用以支持最大边界超平面
  • \(f(x^*)*y_i\)在系数平方和为1时为点到平面的垂直距离,最小化后最大化这个距离是求最大边界超平面的关键

支持向量分类器

支持向量机

多于二分类

  • 一对一分类:对比\(K \choose 2\)个分类器在检验集中的效果,通过计数来选择分类结果
  • 一对多分类:对比K个与剩下的K-1个分类,分类结果最远的认为属于那个分类

与logistic回归关系