位置: 编程技术 - 正文

MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术)

编辑:rootadmin

推荐整理分享MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:mysql开发工程师,mysql开发案例,mysql开发规范,mysql开发案例,mysql数据库开发技术,mysql 开发,mysql 开发,mysql开发规范,内容如对您有帮助,希望把文章链接给更多的朋友!

一、我们遇到了什么问题

在标准SQL里面,我们通常会写下如下的SQL insert语句。

很显然,在MYSQL中,这样的方式也是可行的。但是当我们需要批量插入数据的时候,这样的语句却会出现性能问题。例如说,如果有需要插入条数据,那么就需要有条insert语句,每一句都需要提交到关系引擎那里去解析,优化,然后才能够到达存储引擎做真的插入工作。

正是由于性能的瓶颈问题,MYSQL官方文档也就提到了使用批量化插入的方式,也就是在一句INSERT语句里面插入多个值。即,

这样的做法确实也可以起到加速批量插入的功效,原因也不难理解,由于提交到服务器的INSERT语句少了,网络负载少了,最主要的是解析和优化的时间看似增多,但是实际上作用的数据行却实打实地多了。所以整体性能得以提高。根据网上的一些说法,这种方法可以提高几十倍。

然而,我在网上也看到过另外的几种方法,比如说预处理SQL,比如说批量提交。那么这些方法的性能到底如何?本文就会对这些方法做一个比较。

二、比较环境和方法我的环境比较苦逼,基本上就是一个落后的虚拟机。只有2核,内存为6G。操作系统是SUSI Linux,MYSQL版本是5.6.。

可以想见,这个机子的性能导致了我的TPS一定非常低,所以下面的所有数据都是没有意义的,但是趋势却不同,它可以看出整个插入的性能走向。

由于业务特点,我们所使用的表非常大,共有个字段,且写满(每个字段全部填满,包括varchar)大致会有略小于4KB的大小,而通常来说,一条记录的大小也有3KB。

由于根据我们的实际经验,我们很肯定的是,通过在一个事务中提交大量INSERT语句可以大幅度提高性能。所以下面的所有测试都是建立在每插入条记录提交一次的做法之上。

最后需要说明的是,下面所有的测试都是通过使用MYSQL C API进行的,并且使用的是INNODB存储引擎。

三、比较方法

理想型测试(一)——方法比较

目的:找出理想情况下最合适的插入机制

关键方法:

1. 每个进/线程按主键顺序插入

2. 比较不同的插入方法

3. 比较不同进/线程数量对插入的影响

*“普通方法”指的是一句INSERT只插入一个VALUE的情况。

*“预处理SQL”指的是使用预处理MYSQL C API的情况。

* “多表值SQL(条)”是使用一句INSERT语句插入条记录的情况。为什么是条?后面的验证告诉了我们这样做性能最高。

结论,很显然,从三种方法的趋势上来看,多表值SQL(条)的方式最为高效。

理想型测试(二)——多表值SQL条数比较

MYSQL开发性能研究之批量插入数据的优化方法(mysql数据库开发技术)

很显然,在数据量提高的情况下,每条INSERT语句插入条记录的做法最为高效。

理想型测试(三)——连接数比较

结论:在2倍与CPU核数的连接和操作的时候,性能最高

一般性测试—— 根据我们的业务量进行测试

目的:最佳插入机制适合普通交易情况?

关键方法:

1. 模拟生产数据(每条记录约3KB)

2. 每个线程主键乱序插入

很显然,如果是根据主键乱序插入的话,性能会有直线下降的情况。这一点其实和INNODB的内部实现原理所展现出来的现象一致。但是仍然可以肯定的是,多表值SQL(条)的情况是最佳的。

压力测试

目的:最佳插入机制适合极端交易情况?

关键方法:

1. 将数据行的每一个字段填满(每条记录约为4KB)

2. 每个线程主键乱序插入

结果和我们之前的规律类似,性能出现了极端下降。并且这里验证了随着记录的增大(可能已经超过了一个page的大小,毕竟还有slot和page head信息占据空间),会有page split等现象,性能会下降。

四、结论

根据上面的测试,以及我们对INNODB的了解,我们可以得到如下的结论。

&#;采用顺序主键策略(例如自增主键,或者修改业务逻辑,让插入的记录尽可能顺序主键)

&#;采用多值表(条)插入方式最为合适

&#;将进程/线程数控制在2倍CPU数目相对合适

五、附录

我发现网上很少有完整的针对MYSQL 预处理SQL语句的例子。这里给出一个简单的例子。

c代码

标签: mysql数据库开发技术

本文链接地址:https://www.jiuchutong.com/biancheng/348969.html 转载请保留说明!

上一篇:Django+mysql配置与简单操作数据库实例代码(django使用mysql)

下一篇:Windows下MySQL5.7.18安装教程

  • 一般纳税人做外账没有一点成本票怎么办?
  • 房地产增值税税率是多少
  • 计税工资和实发工资不一样所得税
  • 餐饮费入什么科目
  • 进项票可以抵扣销项票吗
  • 完税证明可以代替契税发票吗
  • 库存现金怎么登记账簿
  • 发票印不上字还能用吗?
  • 企业丢失账簿稽查局可以处罚吗
  • 该企业本月发生如下经济业务
  • 公司聘请专家的差旅费可以税前扣除吗
  • 收到施工方给红包怎样处理
  • 股权转让后没有给转让费怎么办
  • 供应链公司的组织架构图
  • 买东西几块钱忘付了怎么办
  • 去年销售怎么算
  • 一般销售商品业务
  • 所得税汇算清缴时间期限
  • 增值税科目设置的凭证处理方面的特殊要求
  • 税务局金四上线
  • 附加税减半征收计提和缴纳的会计分录
  • 外币报表折算差额会计分录
  • 工程未结算能主张工程款吗
  • 收回长期股权投资账务处理成本法
  • 2021年如何申报海外收入
  • 年终汇算清缴怎么计算
  • 纳税申报表怎么打印
  • 预付款未收到发票如何做账
  • macbook怎么设置输入法
  • window10如何设置休眠时间
  • 企业出售产品前,预收客户一笔货款
  • 农产品核定扣除办法
  • 前端项目中遇到的最大困难,怎么解决的
  • 顺流交易合并抵消 chenyiwei
  • php autoloader
  • PHP:pcntl_wifsignaled()的用法_PCNTL函数
  • 维多利亚国家艺术馆
  • 朝夕教育怎么样
  • 谷歌研究院
  • 建筑保温材料出台了哪些限制政策
  • 没开票的工程可以结转成本吗
  • 运输途中发生的费用
  • 账实不符的后果和对策
  • 进项税大于销项税怎么交税
  • 收到的税费返还怎么算
  • 制造费用怎么摊销到成本?
  • 费用报销票据可以跨年吗
  • 医疗保险个人缴纳比例
  • 营业利润为负数表示什么
  • 应付票据贴现利息收入会计分录
  • 处置固定资产应通过什么账户核算
  • 会计账务做得混乱的原因
  • 怎么开劳务派遣工作证明
  • linux配置mysql数据库远程连接失败的解决方法
  • linux内核模块编译步骤
  • centos查看某个端口
  • /etc/rc.d/rc与/etc/rc.d/init.d的关系介绍
  • win10正版授权图标
  • sesvc.exe是什么进程
  • win8的显示设置
  • win10应用商店不好用
  • android layer
  • 趣谈 linux 操作系统
  • python 字典怎么用
  • linux怎么使用shell脚本
  • 字符串中指定字符变换
  • js文字循环滚动代码
  • python itcast
  • jsoni
  • node中使用什么引入模块
  • javascript运用
  • python网络爬虫项目步骤
  • unity c+
  • jquery导入
  • 电子税务局打印发票提示本机未检测到
  • 国家税务局总局黑龙江分局
  • 现在是一般纳税人,属于小规模发生的业务怎么开票
  • 企业筹建期间发生的费用应计入什么账户
  • 推动税务系统全面从严
  • 地税局申报个人所得税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设