位置: 编程技术 - 正文

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

编辑:rootadmin

推荐整理分享利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python%怎么用,python用pi,利用Python中的运算符可以解决哪些问题,利用Python中的方法和函数提取出给定列表,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G、行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长。于是研究了下Python pandas这个数据处理库的使用。一千万行日志,处理完成在s左右。

代码

pandas 学习笔记

Pandas 中有两种基本的数据结构,Series 和 Dataframe。 Series 是一种类似于一维数组的对象,由一组数据和索引组成。 Dataframe 是一个表格型的数据结构,既有行索引也有列索引。

Series

Series的字符串表现形式为:索引在左边,值在右边。没有指定索引时,会自动创建一个0到N-1(N为数据的长度)的整数型索引。可以通过Series的values和index属性获取其数组表示形式和索引对象:

通常创建Series时会指定索引:

通过索引获取Series中的单个或一组值:

排序

筛选运算

成员

通过字典创建Series

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

当指定index时,sdata中跟states索引相匹配的3个值会被找出并放到响应的位置上,但由于‘Suzhou'所对应的sdata值找不到,所以其结果为NaN(not a number),pandas中用于表示缺失或NA值

pandas的isnull和notnull函数可以用于检测缺失数据:

Series也有类似的实例方法

Series的一个重要功能是,在数据运算中,自动对齐不同索引的数据

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

Series的索引可以通过复制的方式就地修改

DataFrame

pandas读取文件

DataFrame列选取

DataFrame行选取

获取一个元素,可以通过iloc,更快的方式是iat

DataFrame块选取

根据条件过滤行

在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False

增加列

排序

按指定列排序

查看

转置

使用isin

运算操作:

group

group 指的如下几步:

Splitting the data into groups based on some criteria Applying a function to each group independently Combining the results into a data structure

See the Grouping section

group一下,然后应用sum函数

总结

标签: 利用Python中的turtle绘制乡村振兴

本文链接地址:https://www.jiuchutong.com/biancheng/378661.html 转载请保留说明!

上一篇:python下os模块强大的重命名方法renames详解(python os模块)

下一篇:Python运算符重载详解及实例代码(python运算符的用法)

  • 一般纳税人开普票和专票有什么区别
  • 公司出售旧汽车要交什么税
  • 销售自产设备税率
  • 小微企业减半征收城建税
  • 中央空调 付款
  • 没有真实业务的票据贴现
  • 税控盘减免怎么做账
  • 递延收益相关的法律规定
  • 有业务往来的两家公司可以投一个公司吗
  • 赠送给客户的商品怎么做账
  • 开票的时候开票人是管理员
  • 公司需要给员工提供的帮助
  • 工程什么情况下可以索赔
  • 可转换公司债券可以在一定程度上解决的问题是
  • 关于积分的三种账务处理方法
  • 冲销应收账款怎么记账
  • 辞退补偿金怎么算n1吗
  • 天猫魔搭
  • 公司缴纳的契税怎么查询
  • 工资薪金所得具体包括哪些
  • 桔梗的功效与作用吃法
  • php数组实现原理
  • 微信小程序入门指南
  • ros入门21讲
  • 失控发票成本转出怎么做账
  • IntersectionObserver 翻译
  • 最新的目标检测算法2020
  • spring的aoc和aop
  • yii2框架和fastadmin建商城网站哪个好用
  • 中小企业内部分析
  • 企业所得税是怎么产生的
  • 勘察设计费是否含税
  • 购入固定资产的会计科目
  • 以前年度漏记收入
  • mysql数据库导出xml的实现方法
  • win7怎么配置
  • 房屋租赁合同印花税怎么交,一年一次吗
  • 未认证未抵扣的进项税
  • 2020年申报期截止时间
  • 年终奖能算在工资里吗
  • 计提工资时个税挂其他应收款
  • 应付暂估会计处理
  • 企业进出口总额
  • 资产处置费用是资产类科目吗
  • 营业利润包括资本化支出吗
  • 为什么会有进项税和销项税
  • 发票怎么看是普票还是专票
  • 餐饮行业的原材料怎么做账
  • 会计账簿按账页不同可以分为
  • 如何制作会计账簿
  • mysql怎么清理干净
  • xp复制粘贴功能失效
  • centos vsftpd配置
  • windows7的插孔设置在哪
  • 苹果电脑怎么锁文件夹
  • centos怎么看硬盘
  • 中兴新支点操作系统安装教程
  • Mac怎么查看WiFi使用量
  • windows8的ie浏览器在哪
  • win7更改文件名的方法
  • python模拟reversed功能
  • bat定义函数
  • 表格指定高度是多少
  • nodejs读取文件字节数组
  • eclipse开发安卓app实例
  • 浏览器app测试要点
  • javascript中的函数包括内置函数和自定义函数
  • js 小数取整的函数怎么写
  • 如何利用Fabric自动化你的任务
  • javascript开关
  • javascript面向对象编程指南
  • jquery中有几种方法可以来设置和获取样式
  • jquery的使用
  • android应用程序包下载安装
  • 新办企业税务局注册流程
  • 进口哪些情况要交税
  • 电子发票冲红期限
  • 淮北市国家税务总局电话
  • 印花税计征周期
  • 怎么查了?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设