计算机系统应用教程网站

网站首页 > 技术文章 正文

浅谈支持向量机(1)

btikc 2024-11-19 02:03:19 技术文章 3 ℃ 0 评论

小张经常约小美一起吃饭,但他发现小美有时候开心,有时候心情不佳,小张暗暗揣测难道是我选的饭馆不好,影响了小美用餐的心情。他按照餐馆的价格和档次绘制了二维坐标系,并在其中标注了小美的心情,如下所示。

话说小张收入有限,他既想小美开心又想省钱,所以尝试画出了以下三条区分小美喜好的直线,请问哪一条效果更好呢?

如果小张使用第一条线,那么下次他可能会选择档次高的餐馆,点价格偏低的餐品,如图所示。

我们用常理推断小美会不会喜欢小张安排的这次约会?肯定不会,因为小美喜欢的点都在另一边,这边明显属于她不喜欢的。那按照第二条线选择,行不行呢?

肯定可以,小美应该喜欢,但是在保持小美喜欢的前提下点餐价格还有下调空间。比如按第三条线选择。

这样选出来的餐馆很大程度上应该是小美喜欢的,并且实现了价格最小化。这里划分两类样本的方法使用的是支持向量机,基本思想就是找出一条距离两边数据间隔最大的直线,而距离这条直线最近的几个点(两条虚线经过的点),称为支持向量。

事实证明小张理解错误,小美心情的好坏并不取决于餐馆档次和点餐价格,而是和小张选择的聊天话题相关。小张认真回忆了最近一段时间的聊天内容,做出如下图表。

通过观察图像我们发现,小美喜欢和不喜欢的话题交织在一起,如果画直线的话没法把两类话题分开,但画曲线可以轻松区别两类话题。

那这是不是意味着,这个问题不适合使用支持向量机来解决。其实支持向量机可以解决这种线性不可分的问题,它通常采用对数据升维的处理办法,也就是把现有的二维空间的数据映射到三维空间,找到一个合适的平面从而使话题在高维可分。如图所示

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表