位置: 编程技术 - 正文

MySQL分组查询Group By实现原理详解(mysql查询分组后 组内数据)

编辑:rootadmin

推荐整理分享MySQL分组查询Group By实现原理详解(mysql查询分组后 组内数据),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:MySQL分组查询每组取第一条,MySQL分组查询每组取第一条,MySQL分组查询数据,MySQL分组查询 不能用where,MySQL分组查询 不能用where,MySQL分组查询每组取第一条,MySQL分组查询语句,MySQL分组查询每组取第一条,内容如对您有帮助,希望把文章链接给更多的朋友!

由于GROUP BY 实际上也同样会进行排序操作,而且与ORDER BY 相比,GROUP BY 主要只是多了排序之后的分组操作。当然,如果在分组的时候还使用了其他的一些聚合函数,那么还需要一些聚合函数的计算。所以,在GROUP BY 的实现过程中,与 ORDER BY 一样也可以利用到索引。

  在MySQL 中,GROUP BY 的实现同样有多种(三种)方式,其中有两种方式会利用现有的索引信息来完成 GROUP BY,另外一种为完全无法使用索引的场景下使用。下面我们分别针对这三种实现方式做一个分析。

  1、使用松散(Loose)索引扫描实现 GROUP BY

  何谓松散索引扫描实现 GROUP BY 呢?实际上就是当 MySQL 完全利用索引扫描来实现 GROUP BY 的时候,并不需要扫描所有满足条件的索引键即可完成操作得出结果。

  下面我们通过一个示例来描述松散索引扫描实现 GROUP BY,在示例之前我们需要首先调整一下 group_message 表的索引,将 gmt_create 字段添加到 group_id 和 user_id 字段的索引中:

然后再看如下 Query 的执行计划:

我们看到在执行计划的 Extra 信息中有信息显示“Using index for group-by”,实际上这就是告诉我们,MySQL Query Optimizer 通过使用松散索引扫描来实现了我们所需要的 GROUP BY 操作。

下面这张图片描绘了扫描过程的大概实现:

要利用到松散索引扫描实现 GROUP BY,需要至少满足以下几个条件:

◆GROUP BY 条件字段必须在同一个索引中最前面的连续位置;◆在使用GROUP BY 的同时,只能使用 MAX 和 MIN 这两个聚合函数;◆如果引用到了该索引中 GROUP BY 条件之外的字段条件的时候,必须以常量形式存在;

为什么松散索引扫描的效率会很高&#;

MySQL分组查询Group By实现原理详解(mysql查询分组后 组内数据)

因为在没有WHERE子句,也就是必须经过全索引扫描的时候, 松散索引扫描需要读取的键值数量与分组的组数量一样多,也就是说比实际存在的键值数目要少很多。而在WHERE子句包含范围判断式或者等值表达式的时候, 松散索引扫描查找满足范围条件的每个组的第1个关键字,并且再次读取尽可能最少数量的关键字。

2.使用紧凑(Tight)索引扫描实现 GROUP BY

紧凑索引扫描实现 GROUP BY 和松散索引扫描的区别主要在于他需要在扫描索引的时候,读取所有满足条件的索引键,然后再根据读取恶的数据来完成 GROUP BY 操作得到相应结果。

这时候的执行计划的 Extra 信息中已经没有“Using index for group-by”了,但并不是说 MySQL 的 GROUP BY 操作并不是通过索引完成的,只不过是需要访问 WHERE 条件所限定的所有索引键信息之后才能得出结果。这就是通过紧凑索引扫描来实现 GROUP BY 的执行计划输出信息。下面这张图片展示了大概的整个执行过程:

在 MySQL 中,MySQL Query Optimizer 首先会选择尝试通过松散索引扫描来实现 GROUP BY 操作,当发现某些情况无法满足松散索引扫描实现 GROUP BY 的要求之后,才会尝试通过紧凑索引扫描来实现。

当 GROUP BY 条件字段并不连续或者不是索引前缀部分的时候,MySQL Query Optimizer 无法使用松散索引扫描,设置无法直接通过索引完成 GROUP BY 操作,因为缺失的索引键信息无法得到。但是,如果 Query 语句中存在一个常量值来引用缺失的索引键,则可以使用紧凑索引扫描完成 GROUP BY 操作,因为常量填充了搜索关键字中的“差距”,可以形成完整的索引前缀。这些索引前缀可以用于索引查找。而如果需要排序GROUP BY结果,并且能够形成索引前缀的搜索关键字,MySQL还可以避免额外的排序操作,因为使用有顺序的索引的前缀进行搜索已经按顺序检索到了所有关键字。

3.使用临时表实现 GROUP BY

MySQL 在进行 GROUP BY 操作的时候要想利用所有,必须满足 GROUP BY 的字段必须同时存放于同一个索引中,且该索引是一个有序索引(如 Hash 索引就不能满足要求)。而且,并不只是如此,是否能够利用索引来实现 GROUP BY 还与使用的聚合函数也有关系。

前面两种 GROUP BY 的实现方式都是在有可以利用的索引的时候使用的,当 MySQL Query Optimizer 无法找到合适的索引可以利用的时候,就不得不先读取需要的数据,然后通过临时表来完成 GROUP BY 操作。

这次的执行计划非常明显的告诉我们 MySQL 通过索引找到了我们需要的数据,然后创建了临时表,又进行了排序操作,才得到我们需要的 GROUP BY 结果。整个执行过程大概如下图所展示:

当 MySQL Query Optimizer 发现仅仅通过索引扫描并不能直接得到 GROUP BY 的结果之后,他就不得不选择通过使用临时表然后再排序的方式来实现 GROUP BY了。

在这样示例中即是这样的情况。 group_id 并不是一个常量条件,而是一个范围,而且 GROUP BY 字段为 user_id。所以 MySQL 无法根据索引的顺序来帮助 GROUP BY 的实现,只能先通过索引范围扫描得到需要的数据,然后将数据存入临时表,然后再进行排序和分组操作来完成 GROUP BY。

mysql 松散的索引扫描(Loose index scan) 优化GroupBy最有效的办法是当可以直接使用索引来完全获取需要group的字段。使用这个访问方法时,MySQL使用对关键字排序的索引的类型(比如BTREE索引)

MySQL学习笔记小结 慢速SQL:执行时间超过给定时间范围的查询就称为慢速查询。在MySQL中如何记录慢速SQL?答:可以在my.cnf中设置如下信息:[mysqld];enabletheslowquerylog,default1

MySQL优化GROUP BY(松散索引扫描与紧凑索引扫描) 满足GROUPBY子句的最一般的方法是扫描整个表并创建一个新的临时表,表中每个组的所有行应为连续的,然后使用该临时表来找到组并应用累积函数(如果

标签: mysql查询分组后 组内数据

本文链接地址:https://www.jiuchutong.com/biancheng/347548.html 转载请保留说明!

上一篇:mysql性能优化工具--tuner-primer使用介绍(mysql语句性能优化)

下一篇:mysql 松散的索引扫描(Loose index scan)(松散索引和紧凑索引)

  • 海关关税计算公式
  • 带薪年休假如果当年离职补交的年休假钱需要扣个税嘛
  • 办理税务登记之后
  • 增值税电子普通发票怎么作废
  • 成本核算需要哪些基础工作
  • 税费退库怎么做凭证
  • 一正一负发票是什么意思
  • 一般纳税人开专票几个点
  • 现金流量表余额等于货币资金吗
  • 自然人独资企业是什么意思
  • 支付的各项税费包括个人所得税吗
  • 陈列费发票属于什么科目
  • 新成立公司必须报税么
  • 外购货物用于职工福利企业所得税怎么调整
  • 土地增值税允许扣除的评估价
  • 为生产产品而领用材料的实际成本应计入什么账户的借方
  • 固定资产处理收入计入什么科目
  • 软件企业销售服务符合增值税即征即退吗
  • 发票先入账,但发票不对
  • 一般纳税人认定管理办法
  • linux批量删除
  • 本月无生产,有折旧怎么办
  • 税盘没反应
  • 项目单位自筹资金
  • PHP:Memcached::replaceByKey()的用法_Memcached类
  • mssearch.exe - mssearch是什么进程 有什么用
  • 广电默认网关是多少
  • 电脑eb是什么意思
  • 网络延迟高不稳定怎么办
  • windows7简洁版
  • 不合规发票扣除多少
  • Micheldever Wood的蓝铃花,英国汉普郡 (© Hursley/Getty Images Plus)
  • 投资公司要具备什么
  • js怎么把时间戳转为日期yyyy-mm-dd
  • 金融服务企业按照是否办理存款业务
  • Symfony2实现在controller中获取url的方法
  • 应付账款重分类含不含暂估
  • php上传图片并显示
  • vue 组件
  • 公司注册资金多长时间可提出来
  • 机械租赁税率是多少?
  • 洗浴报销票子怎么写
  • 银行账户管理的直接责任人是共享中心核算会计
  • python有public
  • 投资性房地产在建期间需要摊销吗
  • 营改增后房屋租赁税变化
  • 防伪税控开票系统年费
  • 公司为职工承担社保费用
  • 企业哪些进项税不能抵扣
  • 合同权利义务包含债务吗
  • 培训学校不退学费找什么部门
  • 现金日记账一般采用数量金额式
  • 银行定期利息怎么算一年
  • 车船税怎么计账
  • 劳务所得税税率表2023年1月
  • 待发货订单是什么意思
  • 购置成本由什么构成
  • 普票与专票有什么区别报销
  • 财务费用的内容包括哪些
  • 无发票的费用怎么算
  • 装修费用怎么结算
  • 公司发放工资的形式
  • 数据库性能优化面试题
  • mysql太慢
  • xp系统键盘按键错乱
  • macos越狱教程
  • myfastupdate.exe - myfastupdate是什么进程文件 有什么用
  • windows8.1应用商店打不开
  • win8怎么把网速调到最快
  • extend列表
  • linux如何配置jdk
  • unity3d模型怎么制作
  • 瀑布流 css
  • android内存优化三 简书
  • python电话本
  • 企业所得税年度申报表A类
  • 重庆税务信息采集如何操作
  • 比利时个人所得税税率
  • 双流税务总局电话
  • 广州市电子税务局怎样跨区申报税务
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设