位置: 编程技术 - 正文

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

编辑:rootadmin

推荐整理分享利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python%怎么用,python用pi,利用Python中的运算符可以解决哪些问题,利用Python中的方法和函数提取出给定列表,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G、行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长。于是研究了下Python pandas这个数据处理库的使用。一千万行日志,处理完成在s左右。

代码

pandas 学习笔记

Pandas 中有两种基本的数据结构,Series 和 Dataframe。 Series 是一种类似于一维数组的对象,由一组数据和索引组成。 Dataframe 是一个表格型的数据结构,既有行索引也有列索引。

Series

Series的字符串表现形式为:索引在左边,值在右边。没有指定索引时,会自动创建一个0到N-1(N为数据的长度)的整数型索引。可以通过Series的values和index属性获取其数组表示形式和索引对象:

通常创建Series时会指定索引:

通过索引获取Series中的单个或一组值:

排序

筛选运算

成员

通过字典创建Series

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

当指定index时,sdata中跟states索引相匹配的3个值会被找出并放到响应的位置上,但由于‘Suzhou'所对应的sdata值找不到,所以其结果为NaN(not a number),pandas中用于表示缺失或NA值

pandas的isnull和notnull函数可以用于检测缺失数据:

Series也有类似的实例方法

Series的一个重要功能是,在数据运算中,自动对齐不同索引的数据

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

Series的索引可以通过复制的方式就地修改

DataFrame

pandas读取文件

DataFrame列选取

DataFrame行选取

获取一个元素,可以通过iloc,更快的方式是iat

DataFrame块选取

根据条件过滤行

在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False

增加列

排序

按指定列排序

查看

转置

使用isin

运算操作:

group

group 指的如下几步:

Splitting the data into groups based on some criteria Applying a function to each group independently Combining the results into a data structure

See the Grouping section

group一下,然后应用sum函数

总结

标签: 利用Python中的turtle绘制乡村振兴

本文链接地址:https://www.jiuchutong.com/biancheng/378661.html 转载请保留说明!

上一篇:python下os模块强大的重命名方法renames详解(python os模块)

下一篇:Python运算符重载详解及实例代码(python运算符的用法)

  • 上交个人所得税分录
  • 受托加工开票如何选名称
  • 开发票怎么操作
  • 公司注销还能要回钱吗
  • 不动产用于集体福利能否抵扣
  • 银行端查询缴税凭证怎么盖章
  • 生产成本月末转到哪里
  • 410768金税盘
  • 价外费用的判断标准
  • 个人设备投资需要交税吗
  • 固定资产改变用途进项转出
  • 怎么确认外购存货成本?
  • 销货清单和发票金额不一致
  • 政府转账捐赠怎么做分录
  • 周转材料摊销属于什么费用
  • 房地产企业预缴企业所得税怎么算
  • 药企会计租金进项税不能抵扣
  • 增值税发票丢失可以用复印件入账么
  • 个人所得税的标准有几档
  • 结汇汇兑损益账务处理
  • 补贴收入是否缴税
  • 简易计税分包款进项税可以抵扣吗
  • 在Win7中,鼠标非最大化
  • 鸿蒙系统桌面如何设置
  • linux虚拟机在哪里输入命令
  • 冲销货款的会计分录
  • php实现验证码功能
  • Element-UI--<el-switch>的@change回调函数的参数用法
  • 应收的罚款收入计入什么科目
  • LIO-SAM学习与运行测试数据集
  • 福利费可以抵扣进项吗?
  • 建筑业预缴的个人所得税怎么在申报表体现
  • 固定资产转卖会亏本吗
  • 前端实战培训
  • 表关联查询语句
  • php动态语言
  • php制作验证码
  • 软件开发属于技术合同吗
  • 购买电脑做什么分录
  • 会计核算中并不是所有的总分类帐户都需要开设明细账户
  • phpcms 用的是什么模板引擎
  • mongodb如何删除
  • mysql基本sql语句大全(基础用语篇)
  • 公司有收入可以做零申报吗
  • php mysql教程
  • 公司购买的机票可以退吗
  • 累计盈余的主要来源有
  • 企业收到政府补助金80 000元,存入银行
  • 员工拿发票报销账务处理
  • 其他应收款款项性质如何填写
  • 坏账准备计入营业外支出什么明细
  • 还没有开业的公司怎么样
  • 其他应收款收不回来了,如何核销
  • cndll.dll
  • macOS 10.12.2下PDF崩溃严重怎么回事 macOS 10.12.2下PDF崩溃的原因以及解决办法
  • mmc不能打开文件services.msc
  • 受限怎么解除
  • fedora系统怎么安装
  • win10无法安装telnet
  • Mac系统中使用QuickTime Player实现屏幕录像图文教程
  • linux文件系统管理命令
  • el-menu-item
  • JS实现的base64加密解密完整实例
  • perl有什么用
  • javascript的
  • js是函数式编程语言吗
  • 网页中英文切换
  • 使用jquery
  • javascript的
  • 法线贴图应该贴在哪里
  • zabbix 微信
  • javascript原型
  • property_get/property_set
  • 在电子税务局如何增加税种
  • 广州税务举报电话
  • 土地增值税清算条例与实施细则
  • 青岛崂山区税务局官网
  • 河南个体工商户营业执照年检
  • 单位税额怎么算出来的
  • 武汉市国税局长
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设