位置: IT常识 - 正文

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

编辑:rootadmin
猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数

推荐整理分享猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:北京猿创源科技有限公司,猿创设计科技有限公司,猿创教育,猿创教育,猿类的作文,猿文教育科技有限公司怎么样,猿类的作文,猿类的作文,内容如对您有帮助,希望把文章链接给更多的朋友!

这是机器未来的第44篇文章

原文首发地址:https://blog.csdn.net/RobotFutures/article/details/126615267

文章目录1. 概述2. 加载数据集3. 查看数据特征3.1 查看首5行数据3.2 查看数据集每个特征的最大值3.3 查看每个特征的最小值3.4 查看特征均值3.5 查看特征百分位数3.6 查看特征数据分布波动3.8 查看特征样本数量3.9 查看标签数据分布4. 其它常用的科学函数5. 总结1. 概述

本文以鸢尾花的数据预处理为例,描述了科学计算在机器学习使用的示例。

2. 加载数据集

以鸢尾花数据集为例。 鸢尾花数据集有4个特征,1个标签,特征为sepal_length,sepal_width,petal_length,petal_width,分别为花萼长度、花萼宽度,花瓣长度、花瓣宽度,标签为鸢尾花的分类,0,1,2分别代表山鸢尾(Setosa)、变色鸢尾(Versicolor)、维吉尼亚鸢尾(Virginical)

import numpy as npdata = []with open(file='iris.txt',mode='r') as f: f.readline() while True: line = f.readline() if line: data.append(line.strip().split(',')) else: breakdata = np.array(data,dtype=float)# 使用切片提取前4列数据作为特征数据X_data = data[:, :4] # 或者 X_data = data[:, :-1]# 使用切片提取最后1列数据作为标签数据y_data = data[:, -1]data.shape, X_data.shape, y_data.shape((150, 5), (150, 4), (150,))3. 查看数据特征3.1 查看首5行数据X_data[0:5], y_data[0:5](array([[5.1, 3.5, 1.4, 0.2], [4.9, 3. , 1.4, 0.2], [4.7, 3.2, 1.3, 0.2], [4.6, 3.1, 1.5, 0.2], [5. , 3.6, 1.4, 0.2]]), array([0., 0., 0., 0., 0.]))3.2 查看数据集每个特征的最大值# axis = 0指定X轴,取每列的最大值np.max(X_data, axis=0)array([7.9, 4.4, 6.9, 2.5])

上面的取值就是每个特征的最大值,数据集的花萼长度最大值为7.9,花萼宽度最大值为4.4,花瓣长度最大值为6.9,花瓣宽度最大值为2.5

猿创征文|【Python数据科学快速入门系列 | 05】常用科学计算函数(猿猴的作文)

如果去掉轴axis参数,就是取数据集所有数据中的最大值,会综合所有列一起的最大值。

np.max(X_data)7.93.3 查看每个特征的最小值np.min(X_data, axis=0)array([4.3, 2. , 1. , 0.1])

上面的取值就是每个特征的最小值,数据集的花萼长度最小值为4.3,花萼宽度最小值为2,花瓣长度最小值为1,花瓣宽度最小值为0.1

3.4 查看特征均值np.mean(X_data, axis=0)array([5.84333333, 3.05733333, 3.758 , 1.19933333])3.5 查看特征百分位数

百分位数是统计中使用的度量,表示小于这个值的观察值样本数量占总体的百分比。

# 25%np.percentile(X_data, 0.25, axis=0)array([4.33725, 2.0745 , 1.03725, 0.1 ])# 50%np.percentile(X_data, 0.50, axis=0)array([4.3745, 2.149 , 1.0745, 0.1 ])# 75%np.percentile(X_data, 0.75, axis=0)array([4.4 , 2.2 , 1.11175, 0.1 ])3.6 查看特征数据分布波动np.std(X_data, axis=0)array([0.82530129, 0.43441097, 1.75940407, 0.75969263])

从标准差可以看到特征花萼宽度标准差为0.43441097数据波动最小,花瓣长度标准差数据为1.75940407,数据波动最大。

3.8 查看特征样本数量X_data.shape(150, 4)

可以看到样本数量为150,每个样本4个特征

3.9 查看标签数据分布

通过np.unique分别获得唯一ID和对应的样本数量,然后通过zip、dict转换为字典。

unique, count = np.unique(y_data, return_counts=True)label_count = dict(zip(unique, count))label_count{0.0: 50, 1.0: 50, 2.0: 50}

可以看到标签是均衡的,每个分类的样本数均是50.

4. 其它常用的科学函数函数说明示例np.sum求累加np.sum((y_pred - y_data)**2)np.exp以自然常数e为底的指数函数np.exp**2np.var求方差np.var(X_data, axis=0)np.round四舍五入np.round(np.var(X_data, axis=0), decimals=2)np.square求平方np.square(X_data)np.abs求绝对值np.abs([1, -1, -7.9, 6])np.argmax求最大值的位置索引np.argmax(X_data, axis=0)np.argmin求最小值的位置索引np.argmin(X_data, axis=0)…5. 总结

以上就是numpy科学函数的简单介绍,更多api在将来的使用中再描述。

写在末尾:

博客简介:专注AIoT领域,追逐未来时代的脉搏,记录路途中的技术成长!专栏简介:从0到1掌握数据科学常用库Numpy、Matploblib、Pandas。面向人群:AI初级学习者专栏计划:接下来会逐步发布跨入人工智能的系列博文,敬请期待Python零基础快速入门系列Python数据科学系列人工智能开发环境搭建系列机器学习系列物体检测快速入门系列自动驾驶物体检测系列…

本文链接地址:https://www.jiuchutong.com/zhishi/300866.html 转载请保留说明!

上一篇:OpenCV安装教程(全网最细,小白直接上手!!!)(opencv安装教程vs2019)

下一篇:Vue 和 React 有什么不同?(vue和react差别)

  • 做微信营销必须知道的8个技巧(微信营销需要具备什么条件)

    做微信营销必须知道的8个技巧(微信营销需要具备什么条件)

  • 免费、有效的网店推广方式(免费网站有哪些平台)

    免费、有效的网店推广方式(免费网站有哪些平台)

  • 小米手机长按识别文字怎么调出来(小米手机长按识图功能在哪里)

    小米手机长按识别文字怎么调出来(小米手机长按识图功能在哪里)

  • word怎么让字斜45(word怎么把字斜45度)

    word怎么让字斜45(word怎么把字斜45度)

  • 魅族18支持的音频格式有哪些(魅族18有音乐芯片吗)

    魅族18支持的音频格式有哪些(魅族18有音乐芯片吗)

  • applestore怎么删除订单(applestore怎么删除已购买app)

    applestore怎么删除订单(applestore怎么删除已购买app)

  • 华为mate30后面4个摄像头怎么不一样(华为mate30后面的玻璃碎了要多少钱)

    华为mate30后面4个摄像头怎么不一样(华为mate30后面的玻璃碎了要多少钱)

  • 抖音免流量会显示吗(抖音免流量显示在哪里)

    抖音免流量会显示吗(抖音免流量显示在哪里)

  • 删除再拉黑还能再加吗(删除再拉黑还能加好友吗)

    删除再拉黑还能再加吗(删除再拉黑还能加好友吗)

  • 手机屏幕白线如何修复(手机屏幕白线如何去除)

    手机屏幕白线如何修复(手机屏幕白线如何去除)

  • 810和820的区别(810比820)

    810和820的区别(810比820)

  • 5g单模手机以后能用吗(5g单模能用多久)

    5g单模手机以后能用吗(5g单模能用多久)

  • 为什么手机屏幕有暗影(为什么手机屏幕会触控失灵)

    为什么手机屏幕有暗影(为什么手机屏幕会触控失灵)

  • 淘宝亲情号有什么用(淘宝亲情号有什么好处)

    淘宝亲情号有什么用(淘宝亲情号有什么好处)

  • 小米cc9屏幕对比小米9(小米cc9屏幕参数)

    小米cc9屏幕对比小米9(小米cc9屏幕参数)

  • 为什么pdf打印出来缺一部分(为什么pdf打印出来字体不一样)

    为什么pdf打印出来缺一部分(为什么pdf打印出来字体不一样)

  • 腾讯视频怎么调亮度(腾讯视频怎么调画质)

    腾讯视频怎么调亮度(腾讯视频怎么调画质)

  • 淘宝评论可以删除吗(淘宝评论可以删除图片吗)

    淘宝评论可以删除吗(淘宝评论可以删除图片吗)

  • macbook屏幕怎么擦拭(macbook屏幕怎么缩小)

    macbook屏幕怎么擦拭(macbook屏幕怎么缩小)

  • 运算器的功能是什么(ALU运算器的功能是)

    运算器的功能是什么(ALU运算器的功能是)

  • 米兔定位电话用什么卡(米兔定位电话需要流量吗)

    米兔定位电话用什么卡(米兔定位电话需要流量吗)

  • iphone11pro有指纹解锁吗(iphone11pro指纹识别)

    iphone11pro有指纹解锁吗(iphone11pro指纹识别)

  • xr下载app用不了面容id

    xr下载app用不了面容id

  • 图解在OS X中管理窗口大小的多种方法

    图解在OS X中管理窗口大小的多种方法

  • rtmservice.exe - rtmservice是什么进程 有什么用

    rtmservice.exe - rtmservice是什么进程 有什么用

  • 堡垒山上的珀纳里城堡,法加拉斯山,罗马尼亚 (© porojnicu/Getty Images)(堡垒山是哪个国家)

    堡垒山上的珀纳里城堡,法加拉斯山,罗马尼亚 (© porojnicu/Getty Images)(堡垒山是哪个国家)

  • SpringBoot+Vue实现在线商城系统

    SpringBoot+Vue实现在线商城系统

  • 什么是抄报税证明
  • 离境退税政策文件
  • 消费税的计税价格是什么
  • 财务软件交多少钱印花税
  • 怎么做掉公司账户的钱
  • 农产品加工会计分录
  • 小企业会计准则2023电子版
  • 企业无票支出怎么入账
  • 签三方协议需要什么资料
  • 个人所得税当月计提下月申报
  • 福利性收入属于什么分配
  • 个人所得税该如何缴纳
  • 个人交物业费开发票交税点吗
  • 公司解散实收资本会计怎么处理
  • 个税当月计提还是下月
  • 一般个体户核定税率多少
  • 私立幼儿园收的特色课费可以追回吗
  • 科技项目经费怎么申报
  • 贴现扣的钱叫什么
  • 生产酒的税收是多少
  • 2019年一般纳税人附加税减免政策
  • 增值税减免税备案什么时候开始
  • 已发货未开票的货物需要结转成本吗
  • 收到往来款的账务处理
  • 在windows7中,使用鼠标拖放功能
  • 认缴出资日期是2050什么意思
  • javascript中
  • 营改增后房地产企业账务处理
  • neoCapture.exe - neoCapture是什么进程 有什么用
  • 农产品核定扣除办法
  • 持有至到期投资减值准备
  • php异常处理和错误处理
  • 进口的应税消费品,于报关进口时缴纳消费税
  • ci框架教程
  • 无需本地部署的软件
  • python爬取网站数据毕业论文
  • 固定资产到期日
  • 定额发票需要交契税吗
  • 企业和银行对账多久对一次
  • 注册一个公司没有流水可以吗
  • 库存现金借方发生额怎么计算
  • 汽车折旧年限是几年内的
  • 铝合金门窗行业利润率
  • 业务往来接受礼品
  • 企业会计本年利润
  • 财务专用章是干嘛用的
  • 用于出口的进项发票怎么做账
  • 开红字发票如何调整收入?
  • 收到银行承兑汇票
  • 长期待摊费用待摊费用
  • 个人所得税财产转让所得税率
  • 去国外参加展会办什么签证
  • 已付款未认证发票怎么做账
  • 外经证预缴税款必须去外地交税吗
  • 营改增后建筑业怎么开票
  • 工会会费收入计入会计科目
  • 确定所开发票的项目的大类别?
  • 如何判断企业处于什么阶段
  • 营业收入的核算内容包括
  • system表空间满了怎么处理
  • mysql的基本介绍
  • 数据转换常见策略
  • linux 压缩包zip
  • windows10开机黑屏
  • nmstt.exe - nmstt是什么进程 有什么用
  • pavfires.exe - pavfires是什么进程 有什么用
  • linux如何快速入门
  • 编写批处理
  • jquery弹出页面
  • github比较火的项目
  • css标准规范
  • python3条件语句
  • CustomPropertyDrawer-Change the height of Property field
  • django批量创建数据
  • js设置option
  • 河南税务报到
  • 汽车销售环节要做什么
  • 北京税务网上营业厅官网
  • 国有固定资产出租出借安全管理办法
  • 教育费附加地方教育费附加税率
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设