位置: 编程技术 - 正文

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

编辑:rootadmin

推荐整理分享利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python%怎么用,python用pi,利用Python中的运算符可以解决哪些问题,利用Python中的方法和函数提取出给定列表,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,利用Python中的运算符可以编程解决你身边的那些问题,利用Python中的turtle,内容如对您有帮助,希望把文章链接给更多的朋友!

前言

最近工作工作中遇到一个需求,是要根据CDN日志过滤一些数据,例如流量、状态码统计,TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的,但是当日志量较大,日志文件数G、行数达数千万亿级时,通过 shell 处理有些力不从心,处理时间过长。于是研究了下Python pandas这个数据处理库的使用。一千万行日志,处理完成在s左右。

代码

pandas 学习笔记

Pandas 中有两种基本的数据结构,Series 和 Dataframe。 Series 是一种类似于一维数组的对象,由一组数据和索引组成。 Dataframe 是一个表格型的数据结构,既有行索引也有列索引。

Series

Series的字符串表现形式为:索引在左边,值在右边。没有指定索引时,会自动创建一个0到N-1(N为数据的长度)的整数型索引。可以通过Series的values和index属性获取其数组表示形式和索引对象:

通常创建Series时会指定索引:

通过索引获取Series中的单个或一组值:

排序

筛选运算

成员

通过字典创建Series

如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)

当指定index时,sdata中跟states索引相匹配的3个值会被找出并放到响应的位置上,但由于‘Suzhou'所对应的sdata值找不到,所以其结果为NaN(not a number),pandas中用于表示缺失或NA值

pandas的isnull和notnull函数可以用于检测缺失数据:

Series也有类似的实例方法

Series的一个重要功能是,在数据运算中,自动对齐不同索引的数据

利用Python中的pandas库对cdn日志进行分析详解(利用Python中的turtle绘制乡村振兴)

Series的索引可以通过复制的方式就地修改

DataFrame

pandas读取文件

DataFrame列选取

DataFrame行选取

获取一个元素,可以通过iloc,更快的方式是iat

DataFrame块选取

根据条件过滤行

在方括号中加入判断条件来过滤行,条件必需返回 True 或者 False

增加列

排序

按指定列排序

查看

转置

使用isin

运算操作:

group

group 指的如下几步:

Splitting the data into groups based on some criteria Applying a function to each group independently Combining the results into a data structure

See the Grouping section

group一下,然后应用sum函数

总结

标签: 利用Python中的turtle绘制乡村振兴

本文链接地址:https://www.jiuchutong.com/biancheng/378661.html 转载请保留说明!

上一篇:python下os模块强大的重命名方法renames详解(python os模块)

下一篇:Python运算符重载详解及实例代码(python运算符的用法)

  • 不确认递延所得税的特殊情况
  • 无票收入怎么做账,要交税吗,填入增值税申报表
  • 增值税发票选择确认平台是什么?
  • 企业新成立,何种情况下需要开始记账报税
  • 增值税普通发票需要交税吗
  • 公司被员工劳动仲裁
  • 报销人和经办人怎么区分
  • 小规模超过10万是全额交税吗
  • 增值税税金不足1元未缴纳账务处理
  • 转让长期股权投资的净收益计入
  • 房地产企业开发成本科目明细
  • 买空调交税是谁交税
  • 外籍员工缴纳商业保险
  • 香港公司在大陆设立子公司
  • 加计扣除农产品包括哪些
  • 案例分析关于团员青年的思想困惑疏导和成长问题释疑
  • 商标是按年交费的吗
  • 增值税在免税范围内,附加税怎么做
  • 3月申报的是什么时候的个税
  • 二手店铺转让手续流程
  • 企业出口产品条件和流程
  • 收到支票怎么处理
  • 长租押金多少合适
  • 增值税申报表中期初未缴税额指什么
  • 员工出差买的保险怎么入账
  • 本年利润在借方表示什么意思
  • macbook自带的游戏
  • 收到购买商品发票怎么做账
  • appdata如何移动
  • mac安装软件提示身份不明
  • 计提理财利息分录
  • 国家高新技术企业认定评分标准
  • php nl2br
  • 交易性金融资产属于什么科目
  • php email
  • 汽车购置税计算公式
  • 咨询类公司可以坐零售吗
  • 附加税多交了怎么办理退税
  • 基于stm32的小游戏
  • 这是我见过最牛的人英语
  • php 后期静态绑定
  • calc下载
  • 车船税怎么计算
  • 开通对公账号怎么办理
  • python代码用什么运行
  • 总公司签合同开票分公司做业务分公司如何确认收入?
  • sqlserver2008数据库文件路径
  • 信用证保证金账户属于什么账户性质
  • 发票开错抬头做红字发票的账务处理是?
  • 收到的发票未抵税怎么办
  • 所得税费用科目的期末余额应直接转入
  • 专票红冲信息表填开显示红字信息表金额大于蓝色金额
  • 房屋如何计提折旧费
  • 企业与股东之间的关系,也是企业与投资者之间的关系
  • 溢价发行可转换债券 利息调整在贷方吗
  • 铁路运费印花税怎么算
  • 资产减值的含义与应用范围
  • 预付款项为什么属于资产
  • 行政事业单位固定资产入账标准最新规定
  • 房地产企业的土地使用权计入什么科目
  • ubuntu如何回到桌面
  • windows中的服务
  • zui哪个版本最好
  • win7系统电脑蓝牙在哪里
  • javascrapt
  • 安卓手机更新时间
  • python数据导出
  • node.js ts
  • javascript新手教程
  • jquery获取文件大小
  • python3新增特性
  • springmvc返回json格式的注解
  • 中国税务局河北省税务局官网
  • 特岗教师服务期满证书
  • 新公司税务登记完后还需要什么流程
  • 重庆地方税务局2016年2号
  • 00后先进人物事迹简介
  • 外汇管理数字外管平台怎么登录
  • 北京地税局报税流程
  • 征地税税率是多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设