位置: IT常识 - 正文

【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

编辑:rootadmin
【数据挖掘】-支持向量机(SVM)+代码实现

目录

从例子出发

算法原理

超平面

支持向量

如何处理不清晰的边界

​非线性可分的情况

常见的核函数​

算法的优点

代码的实现

总结


从例子出发

推荐整理分享【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:数据挖掘需要学哪些,数据挖掘需要学哪些,数据挖掘工程师,数据挖掘工具,数据挖掘的基本流程,数据挖掘工具,数据挖掘工具,数据挖掘需要学哪些,内容如对您有帮助,希望把文章链接给更多的朋友!

 算法原理

支持向量机(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,可以将问题化为一个求解凸二次规划的问题。与逻辑回归和神经网络相比,支持向量机,在学习复杂的非线性方程时提供了一种更为清晰,更加强大的方式。

具体来说就是在线性可分时,在原空间寻找两类样本的最优分类超平面。在线性不可分时,加入松弛变量并通过使用非线性映射将低维度输入空间的样本映射到高维度空间使其变为线性可分,这样就可以在该特征空间中寻找最优分类超平面。

 超平面

支持向量【数据挖掘】-支持向量机(SVM)+代码实现(数据挖掘论文选题)

假设找到一条线可以分割红豆和绿豆 红豆和绿豆中距离这条线最近的几个样本点被称为支持向量(Support Vector) 这些点到这条线的距离称为间隔 在决定最佳超平面时只有支持向量起作用,而其他数据点并不起作用

如何处理不清晰的边界

非线性可分的情况

SVM中采取的办法是: 把不可划分的样本映射到高维空间中

在SVM中借助“核函数”,来实现映射到高维的操作

 常见的核函数

算法的优点

 支持向量机算法可以解决小样本情况下的机器学习问题,简化了通常的分类和回归等问题。 由于采用核函数方法克服了维数灾难和非线性可分的问题,所以向高维空间映射时没有增加计算的复杂性。换句话说,由于支持向量计算法的最终决策函数只由少数的支持向量所确定,所以计算的复杂性取决于支持向量的数目,而不是样本空间的维数。 支持向量机算法利用松弛变量可以允许一些点到分类平面的距离不满足原先要求,从而避免这些点对模型学习的影响。

 算法的缺点 

支持向量机算法对大规模训练样本难以实施。这是因为支持向量机算法借助二次规划求解支持向量,这其中会涉及m阶矩阵的计算,所以矩阵阶数很大时将耗费大量的机器内存和运算时间。 经典的支持向量机算法只给出了二分类的算法,而在数据挖掘的实际应用中,一般要解决多分类问题,但支持向量机对于多分类问题解决效果并不理想。 SVM算法效果与核函数的选择关系很大,往往需要尝试多种核函数,即使选择了效果比较好的高斯核函数,也要调参选择恰当的参数。另一方面就是现在常用的SVM理论都是使用固定惩罚系数C,但正负样本的两种错误造成的损失是不一样的。

 代码的实现from sklearn import datasetsfrom sklearn import svm#引入svm包import numpy as npnp.random.seed(0)iris=datasets.load_iris()iris_x=iris.datairis_y=iris.targetindices= np.random.permutation(len(iris_x))iris_x_train = iris_x[indices[:-10]]iris_y_train= iris_y[indices[:-10]]iris_x_test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel = 'linear')clf.fit(iris_x_train,iris_y_train)#拟合#调用该对象的测试方法,主要接收一个参数:测试数据集

iris_x__test = iris_x[indices[-10:]]iris_y_test = iris_y[indices[-10:]]#使用线性核SVC是分类支持向量机的意思,另外还有SVR是回归支持向量机clf = svm.SVC(kernel= 'linear')clf.fit(iris_x_train,iris_y_train) #拟合#调用该对象的测试方法,主要接收一个参数:测试数据集iris_y_predict= clf.predict(iris_x_test)#调用该对象的打分方法,计算出准确率score=clf.score(iris_x_test,iris_y_test,sample_weight=None)print('iris_y_predict=')print(iris_y_predict)print('iris_y_test= ')print(iris_y_test)print('Accuracy:"',score)

 

总结

支持向量机算法分类和回归方法的中都支持线性性和非线性类型的数据类型。非线性类型通常是二维平面不可分,为了使数据可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易可分,需要通过一个函数将原始数据映射到高维空间,从而使得数据在高维空间很容易区分,这样就达到数据分类或回归的目的,而实现这一目标的函数称为核函数。

工作原理:当低维空间内线性不可分时,可以通过高位空间实现线性可分。但如果在高维空间内直接进行分类或回归时,则存在确定非线性映射函数的形式和参数问题,而最大的障碍就是高维空间的运算困难且结果不理想。通过核函数的方法,可以将高维空间内的点积运算,巧妙转化为低维输入空间内核函数的运算,从而有效解决这一问题。

本文链接地址:https://www.jiuchutong.com/zhishi/300749.html 转载请保留说明!

上一篇:Vue.js介绍(vue.js简介)

下一篇:Vue.js 状态管理:Pinia 与 Vuex(vuex状态机)

  • 为何你费尽心思去做用户调研,却总造出一堆垃圾产品(费尽了心思是什么意思)

    为何你费尽心思去做用户调研,却总造出一堆垃圾产品(费尽了心思是什么意思)

  • 同步steam云怎么关闭

    同步steam云怎么关闭

  • 抖音极速版压岁钱卡怎么集(抖音极速版128元上线)

    抖音极速版压岁钱卡怎么集(抖音极速版128元上线)

  • 怎么查微信所有的支出(怎么查微信所有图片记录)

    怎么查微信所有的支出(怎么查微信所有图片记录)

  • ppt中对文本或段落进行缩进怎么设置(ppt文本部分)

    ppt中对文本或段落进行缩进怎么设置(ppt文本部分)

  • 快手小店保证金退了还可以再交吗(快手小店保证金是干嘛的)

    快手小店保证金退了还可以再交吗(快手小店保证金是干嘛的)

  • 三星息屏提醒横过来了(三星息屏提醒太暗了)

    三星息屏提醒横过来了(三星息屏提醒太暗了)

  • 红包省钱卡商家会亏吗(红包省钱卡 商家)

    红包省钱卡商家会亏吗(红包省钱卡 商家)

  • 电脑按什么键发送(电脑什么键是发送键)

    电脑按什么键发送(电脑什么键是发送键)

  • 小米能识别到卡但是没信号(小米能识别到卡里的钱吗)

    小米能识别到卡但是没信号(小米能识别到卡里的钱吗)

  • 什么情况下使用邮件合并(什么情况下使用胰岛素)

    什么情况下使用邮件合并(什么情况下使用胰岛素)

  • 计算机主机通常指(计算机主机通常指什么)

    计算机主机通常指(计算机主机通常指什么)

  • 微信登录设备管理恢复(微信登录设备管理怎么查看)

    微信登录设备管理恢复(微信登录设备管理怎么查看)

  • 抖音的流量在哪里可以看到(抖音的流量在哪里买)

    抖音的流量在哪里可以看到(抖音的流量在哪里买)

  • 快手同城置顶什么意思(快手置顶好不好)

    快手同城置顶什么意思(快手置顶好不好)

  • 微信传图识字是免费的吗(微信 传图识字)

    微信传图识字是免费的吗(微信 传图识字)

  • 为什么输入抖音号找不到用户(为什么输入抖音账号搜索不到)

    为什么输入抖音号找不到用户(为什么输入抖音账号搜索不到)

  • 华为鲲鹏是什么意思(华为鲲鹏是什么股票)

    华为鲲鹏是什么意思(华为鲲鹏是什么股票)

  • 苹果xr额头会闪灯吗(苹果xr摄像头频闪)

    苹果xr额头会闪灯吗(苹果xr摄像头频闪)

  • 一键换机微信聊天记录还有吗(一键换机微信聊天记录可以换到新手机么)

    一键换机微信聊天记录还有吗(一键换机微信聊天记录可以换到新手机么)

  • 苹果8现在还值得买吗(苹果8现在还值得换电池吗)

    苹果8现在还值得买吗(苹果8现在还值得换电池吗)

  • vivo手机怎么设置sos求救(vivo手机怎么设置老年模式)

    vivo手机怎么设置sos求救(vivo手机怎么设置老年模式)

  • 键盘线插哪里(键盘线插口)

    键盘线插哪里(键盘线插口)

  • win11如何设置暂停更新?(如何暂停win11更新)

    win11如何设置暂停更新?(如何暂停win11更新)

  • yolov7和yolov5对比有哪些优势?yolov7改进-yolov7详解(yolov5s和yolov5m)

    yolov7和yolov5对比有哪些优势?yolov7改进-yolov7详解(yolov5s和yolov5m)

  • 使用ChatGPT进行AI对话

    使用ChatGPT进行AI对话

  • 工资储备金制度
  • 利润的敏感性分析怎么做?
  • 企业所得税法允许税前扣除的费用划分为
  • 电子税务局没有发票开具
  • 公司自有房产自用要交房产税吗
  • 小规模30万免税是含税还是不含税
  • 过路费按照什么缴纳增值税
  • 员工备用金期末未报销怎么处理
  • 子公司计提的盈余公积如何抵消
  • 期末应交企业所得税怎么算
  • 应收账款对应的科目有哪些
  • 代订机票款发票可以作为机票报销差旅吗
  • 营改增之后对企业的影响
  • 注册资本的变更
  • 不锈钢交几个点税
  • 用人单位有残疾补贴吗
  • 小规模减半征收印花税的政策
  • 会计所得税和税法所得税
  • 房地产记账凭证
  • 劳务费属于会计什么科目
  • 代账代税与自行核算申报应从哪几个角度考虑
  • 增值税普通发票有什么用
  • 购进材料用于在建工程进项税
  • 无法启动个人热点iphone
  • 营改增之后账务怎么处理
  • 在途物资和材料采购属于存货吗
  • php批量发送邮件
  • php流程引擎
  • 租金收入计入收入总额吗
  • wordpress简码怎么用
  • 未确认融资费用怎么算
  • php常用工具
  • 补缴房产税和土地使用税会计分录
  • 给客户开的发票,在邮寄过程中丢了怎么办?
  • qt+opencv教程
  • 基于深度学习的图像超分辨率——综述
  • pyecharts 表格
  • ai绘画网站
  • 港股上市公司股票代码
  • mac中mysql应该怎么运行
  • 个人所得税计算器公式
  • 受雇于两家公司补税怎么算
  • sql server列属性
  • 捐赠的增值税可以抵扣吗
  • 企业减少注册资本
  • 买电脑怎么做账
  • 一般纳税人怎么算税
  • 企业内部罚没收入违法吗
  • 增值税 附加税费
  • 两个公司之间怎么走账
  • 招标公司的成本控制
  • 本年利润每个月需要结转吗
  • 企业的其他应付款增加了说明什么
  • 企业应收账款的规模受哪些因素的影响?( )
  • 资产报废需要税费吗
  • 新三板奖励
  • 私营公司融资租房合法吗
  • mysqlw3school
  • windows任务管理器命令
  • 应用程序发生异常如何解决
  • 虚拟机怎么手动设置ip地址
  • Winaw32.exe - Winaw32是什么进程
  • windows7文件夹选项在哪里
  • linux系统怎么增大磁盘io
  • 在linux系统中拥有
  • win7不激活怎么换壁纸
  • cocos安装
  • 微信小程序列表显示
  • Extjs优化(一)删除冗余代码提高运行速度
  • cocos creator rpg
  • android auto翻译
  • unity的shader用法
  • 置顶什么意思啊
  • python连接mq
  • 发票 字体
  • 国家税务局天津市税务总局官网
  • 船舶吨税 税率
  • 百旺金赋跨月专票作废
  • 国企人事处长是什么级别?
  • 出口增加为什么汇率会增加
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设