位置: IT常识 - 正文

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

编辑:rootadmin
猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数

推荐整理分享猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:北京猿创源科技有限公司,猿创设计科技有限公司,猿创教育,猿创教育,猿类的作文,猿文教育科技有限公司怎么样,猿类的作文,猿类的作文,内容如对您有帮助,希望把文章链接给更多的朋友!

这是机器未来的第44篇文章

原文首发地址:https://blog.csdn.net/RobotFutures/article/details/126615267

文章目录1. 概述2. 加载数据集3. 查看数据特征3.1 查看首5行数据3.2 查看数据集每个特征的最大值3.3 查看每个特征的最小值3.4 查看特征均值3.5 查看特征百分位数3.6 查看特征数据分布波动3.8 查看特征样本数量3.9 查看标签数据分布4. 其它常用的科学函数5. 总结1. 概述

本文以鸢尾花的数据预处理为例,描述了科学计算在机器学习使用的示例。

2. 加载数据集

以鸢尾花数据集为例。 鸢尾花数据集有4个特征,1个标签,特征为sepal_length,sepal_width,petal_length,petal_width,分别为花萼长度、花萼宽度,花瓣长度、花瓣宽度,标签为鸢尾花的分类,0,1,2分别代表山鸢尾(Setosa)、变色鸢尾(Versicolor)、维吉尼亚鸢尾(Virginical)

import numpy as npdata = []with open(file='iris.txt',mode='r') as f: f.readline() while True: line = f.readline() if line: data.append(line.strip().split(',')) else: breakdata = np.array(data,dtype=float)# 使用切片提取前4列数据作为特征数据X_data = data[:, :4] # 或者 X_data = data[:, :-1]# 使用切片提取最后1列数据作为标签数据y_data = data[:, -1]data.shape, X_data.shape, y_data.shape((150, 5), (150, 4), (150,))3. 查看数据特征3.1 查看首5行数据X_data[0:5], y_data[0:5](array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2]]), array([0., 0., 0., 0., 0.]))3.2 查看数据集每个特征的最大值# axis = 0指定X轴,取每列的最大值np.max(X_data, axis=0)array([7.9, 4.4, 6.9, 2.5])

上面的取值就是每个特征的最大值,数据集的花萼长度最大值为7.9,花萼宽度最大值为4.4,花瓣长度最大值为6.9,花瓣宽度最大值为2.5

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

如果去掉轴axis参数,就是取数据集所有数据中的最大值,会综合所有列一起的最大值。

np.max(X_data)7.93.3 查看每个特征的最小值np.min(X_data, axis=0)array([4.3, 2. , 1. , 0.1])

上面的取值就是每个特征的最小值,数据集的花萼长度最小值为4.3,花萼宽度最小值为2,花瓣长度最小值为1,花瓣宽度最小值为0.1

3.4 查看特征均值np.mean(X_data, axis=0)array([5.84333333, 3.05733333, 3.758 , 1.19933333])3.5 查看特征百分位数

百分位数是统计中使用的度量,表示小于这个值的观察值样本数量占总体的百分比。

# 25%np.percentile(X_data, 0.25, axis=0)array([4.33725, 2.0745 , 1.03725, 0.1 ])# 50%np.percentile(X_data, 0.50, axis=0)array([4.3745, 2.149 , 1.0745, 0.1 ])# 75%np.percentile(X_data, 0.75, axis=0)array([4.4 , 2.2 , 1.11175, 0.1 ])3.6 查看特征数据分布波动np.std(X_data, axis=0)array([0.82530129, 0.43441097, 1.75940407, 0.75969263])

从标准差可以看到特征花萼宽度标准差为0.43441097数据波动最小,花瓣长度标准差数据为1.75940407,数据波动最大。

3.8 查看特征样本数量X_data.shape(150, 4)

可以看到样本数量为150,每个样本4个特征

3.9 查看标签数据分布

通过np.unique分别获得唯一ID和对应的样本数量,然后通过zip、dict转换为字典。

unique, count = np.unique(y_data, return_counts=True)label_count = dict(zip(unique, count))label_count{0.0: 50, 1.0: 50, 2.0: 50}

可以看到标签是均衡的,每个分类的样本数均是50.

4. 其它常用的科学函数函数说明示例np.sum求累加np.sum((y_pred - y_data)**2)np.exp以自然常数e为底的指数函数np.exp**2np.var求方差np.var(X_data, axis=0)np.round四舍五入np.round(np.var(X_data, axis=0), decimals=2)np.square求平方np.square(X_data)np.abs求绝对值np.abs([1, -1, -7.9, 6])np.argmax求最大值的位置索引np.argmax(X_data, axis=0)np.argmin求最小值的位置索引np.argmin(X_data, axis=0)…5. 总结

以上就是numpy科学函数的简单介绍,更多api在将来的使用中再描述。

写在末尾:

博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。面向人群:AI初级学习者专栏计划:接下来会逐步发布跨入人工智能的系列博文,敬请期待Python零基础快速入门系列Python数据科学系列人工智能开发环境搭建系列机器学习系列物体检测快速入门系列自动驾驶物体检测系列…

本文链接地址:https://www.jiuchutong.com/zhishi/300866.html 转载请保留说明!

上一篇:OpenCV安装教程(全网最细,小白直接上手!!!)(opencv安装教程vs2019)

下一篇:Vue 和 React 有什么不同?(vue和react差别)

  • Win10系统怎么设置多时区时钟(win10系统怎么设置自动关机)

    Win10系统怎么设置多时区时钟(win10系统怎么设置自动关机)

  • 支付宝下面的生活怎么去掉(支付宝下面生活怎么关闭)

    支付宝下面的生活怎么去掉(支付宝下面生活怎么关闭)

  • 锤子od103是哪一款(锤子od103是什么手机)

    锤子od103是哪一款(锤子od103是什么手机)

  • ipad air2支持pd快充吗(ipad air2用pd快充)

    ipad air2支持pd快充吗(ipad air2用pd快充)

  • 蓝牙耳机说话听不清楚(蓝牙耳机说话听不见怎么回事)

    蓝牙耳机说话听不清楚(蓝牙耳机说话听不见怎么回事)

  • 收款码给别人有风险吗(收款码给别人有关系吗)

    收款码给别人有风险吗(收款码给别人有关系吗)

  • sql语言具有哪三个常见功能(sql语言具有哪三大功能)

    sql语言具有哪三个常见功能(sql语言具有哪三大功能)

  • 苹果11怎么设置身份证打电话(苹果11怎么设置双卡双待)

    苹果11怎么设置身份证打电话(苹果11怎么设置双卡双待)

  • 手机为什么连不上蓝牙(手机为什么连不上蓝牙耳机)

    手机为什么连不上蓝牙(手机为什么连不上蓝牙耳机)

  • 京东发货为何是接货仓(在京东购物 商家为什么发的不是京东物流)

    京东发货为何是接货仓(在京东购物 商家为什么发的不是京东物流)

  • sd wan到底是什么(sd-wan sdn)

    sd wan到底是什么(sd-wan sdn)

  • 不要好友辅助能找回qq密码吗

    不要好友辅助能找回qq密码吗

  • 华为p30微信聊天记录删除了怎么恢复(华为p30微信聊天怎么弄小窗口)

    华为p30微信聊天记录删除了怎么恢复(华为p30微信聊天怎么弄小窗口)

  • 一个钉钉能加两个班级吗(一个钉钉能加两个班级吗怎么加)

    一个钉钉能加两个班级吗(一个钉钉能加两个班级吗怎么加)

  • 蓝牙音量小是什么原因(蓝牙手机音量小)

    蓝牙音量小是什么原因(蓝牙手机音量小)

  • 电脑网线插路由器哪个口(电脑网线插路由器上就能用吗)

    电脑网线插路由器哪个口(电脑网线插路由器上就能用吗)

  • pencil多久充满(pencil充多久才会满)

    pencil多久充满(pencil充多久才会满)

  • usb接口有几种(usb接口有几种图片)

    usb接口有几种(usb接口有几种图片)

  • 电脑能开机但是电脑屏幕没有反应为什么(电脑能开机但是黑屏怎么办)

    电脑能开机但是电脑屏幕没有反应为什么(电脑能开机但是黑屏怎么办)

  • 显示屏75hz和144hz有什么区别(显示屏75hz和165hz有什么区别)

    显示屏75hz和144hz有什么区别(显示屏75hz和165hz有什么区别)

  • 主频是指什么的时钟频率(主频是指什么的运算工作频率)

    主频是指什么的时钟频率(主频是指什么的运算工作频率)

  • 128mb是多大内存是几g(128mb有多大)

    128mb是多大内存是几g(128mb有多大)

  • 华硕360和365主板对比(华硕360和365区别)

    华硕360和365主板对比(华硕360和365区别)

  • 手机突然显示不显卡什么原因(手机突然显示不可上网)

    手机突然显示不显卡什么原因(手机突然显示不可上网)

  • 手机运行内存越来越小(手机运行内存越大玩游戏越流畅吗)

    手机运行内存越来越小(手机运行内存越大玩游戏越流畅吗)

  • 3d打印原型制作的四个流程分别为(3d打印原型制作教程)

    3d打印原型制作的四个流程分别为(3d打印原型制作教程)

  • 西瓜视频怎么上传视频(打开西瓜视频app)

    西瓜视频怎么上传视频(打开西瓜视频app)

  • 织梦后台直接添加会员功能开发方法(织梦怎么建站)

    织梦后台直接添加会员功能开发方法(织梦怎么建站)

  • 山东省增值税发票勾选认证平台
  • 投资公司取得的投资收益属于销售额吗
  • 什么叫征期抄税?
  • 民办非企业所得税优惠政策
  • 公司的纳税人识别号怎么查询
  • 金蝶财务软件固定资产模块固定资产调拨
  • 其他流动资产待抵扣进项税额
  • 预支的采购备用金是什么
  • 如何理解定时是指收入在什么时候记入账册?
  • 购进固定资产汽车该如何进行会计处理?
  • 增值税普通发票可以抵扣吗
  • 所得税汇算清缴时间期限
  • 租赁到期日 英语
  • 增值税专票的收款人必须是个人嘛
  • 企业购销业务流程包括哪些
  • 溢价转让股权的会计处理
  • 列入工资的补贴是什么
  • 外来原始凭证是指企业财会部门从外部购入的原始凭证
  • 个人转租房子
  • 物流公司增项
  • 所得税工资薪金允许税前扣除
  • 外贸企业内销与外销对比
  • 质量扣款入什么科目
  • 工会经费的计税依据包括单位社保吗
  • 采购不签合同
  • 固定资产资产评估
  • macbookzen
  • wordpress 设置
  • 电脑启用aero
  • 发票真伪查询的金额填多少
  • 高新技术企业补助需要交所得税吗
  • 什么收入不用缴纳增值税
  • 借款凭证会计分录是什么
  • 转让子公司产生的投资收益在合并层面是不是全部抵消
  • vue.min.js 本地引入
  • 不动产抵债的销售额
  • 税务机关如何判别c开发票视频
  • 阿尔莫什
  • vue控制按钮是否禁用
  • xml格式化输出
  • php5.4安装教程
  • 管理费用的主要科目
  • thinkphp教程
  • php字符串比较函数怎么写
  • 律师费开票税费谁承担
  • 交易性金融资产属于什么科目
  • 建筑企业预缴税率
  • sql server的数据库
  • 小规模免征增值税的会计处理办法
  • 税款减免怎么做分录
  • 代缴车险
  • 应付利息属于什么负债
  • 经济补偿金如何做账
  • 银行收到货款会计分录怎么做
  • 工程进度开票如何入账
  • 场地租用招标方案怎么写
  • 会计如何建账做账
  • 企业明细是什么
  • Centos下Mysql安装图文教程
  • mysql null+1
  • win7系统怎样
  • win8系统开机界面
  • vs显示进程已退出
  • windows7的使用期限
  • Winaw32.exe - Winaw32是什么进程
  • aow_exe.exe是什么进程
  • exfat 打不开
  • windows8.1界面
  • 系统升级为中狼
  • win7系统回收站不见了怎么办
  • javascript数组的应用
  • jquery点击事件写法
  • Android中dip、dp、sp、pt和px的区别
  • java script教程
  • Android SDK Manager无法更新的解决方案
  • 基于python的研究
  • 江苏省税务局书记局长
  • 电子税务局使用率低的原因
  • 开电影院有哪些要求
  • 亏损可以结转吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设