位置: 编程技术 - 正文

多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序)

编辑:rootadmin
然而,微软sql server在处理这类索引时,有个重要的缺陷,那就是把本该编译成索引seek的操作编成了索引扫描,这可能导致严重性能下降 举个例子来说明问题,假设某个表T有索引 ( cityid, sentdate, userid), 现在有个分页列表功能,要获得大于某个多列复合索引V0的若干个记录的查询,用最简单表意的方式写出来就是 V >= V0, 如果分解开来,就是: cityid > @cityid0 or (cityid = @cityid0 and (sentdate > @sentdate0 or (sentdate = @sentdate0 and userid >= @userid0))), 当你写出上述查询时,你会期待sql server会自动的把上述识别为V >= V0类型的边界条件,并使用index seek操作来实施该查询。然而,微软的sql server (版)有一个重要缺陷(其他的sql server如何还不得知), 当它遇到这样sql时,sql server就会采用index scan来实施,结果是您建立好的索引根本就没有被使用,如果这个表的数据量很大,那所造成的性能下降是非常大的。 对于这个问题,我曾经提交给微软的有关人士,他们进一步要求我去一个正式的网站上去提交这个缺陷,我懒得去做。 不过,对这个缺陷,还是有个办法能够绕过去的,只要把上面给出的条件变变形,sql server还是能够变回到是用index seek, 而不是低性能的index scan. 具体请看我的英文原文吧(对不起了, 我一旦写了中文,就不想翻成英文,反过来也一样, 估计大家英文都还可以,实在不行的就看黑体部分吧, ): The seek predicate of the form "x > bookmark_of_x" is needed in paging related query. The compiler has no difficulty to parse it correctly if x is a single column index, or two columns index, however, if x is a three columns index or more, then the compiler will have a hard time to recognize it. This failure will result in that the seek predicate ended up in residue predicate, which results in a much worse execution plan. To illustrate the point, take a example, Create table A( a int, b int, c int, d float, primary key (a, b, c)) now check the plan for the query: select c, d from A where (a> or a= and (b > or b = and c > )) you can see a table scan op is used, and the Where clause ended up in residue predicate. However, if you rewrite the query in an equivalent form: select c, d from A where a> or a= and b > or a= and b= and c > Then the compiler can choose an index seek op, which is desired. The problem is, the compiler should be able to recognize the first form of seek predicate on multiple columns index, it saves the user from having to pay extra time to figure out a get-around, not to mention the first form is a more efficient form of same expression. 上面的问题,可以说是部分的绕过去了,但是,也有绕不过的时候,接着看下面一段: It looks like that sql server lacks a consept of vector bookmark, or vector comparison or whatever you like to call it. The workaround is not a perfect workaround. If sql server were to understand the concept of vector bookmark, then the following two would be the same in execution plan and performance: 1. select top(n) * from A where vectorIndex >= @vectorIndex 2. select * from A where vectorIndex >= @vectorIndex and vectorIndex <=@vectorIndexEnd -- @vectorIndexEnd corresponds to the last row of 1. However, test has shown that, the second statement takes far more time than the first statement, and sql server actually only seek to the begining of the vector range and scan to the end of the whole Index, instead of stop at the end of the vector range. Not only sql server compile badly when the vector bookmark has 3 columns, test has shown that even with as few as 2 columns, sql serer still can not correctly recognize this is actually a vector range, example: 3. select top () a, b, c, d from A where a> or a= and b > 4. select a, b, c, d from A where (a> or a= and b > ) and (a< or a= and b <= ), 上面两个查询实质相同(表中的数据刚好如此),并且给出同业的结果集,但是,3比4的速度要快的多,如果去看execution plan也证明3确实应当比4快. 也就是说, 即使在索引vectorIndex只含两列的情况下, sql server也无法正确的理解范围表达式 @vectorIndex0 < vectorIndex < @vectorIndex1, 它能把前半部分正确的解读为seek, 但是, 后半部分无法正确解读, 导致, sql server会一直扫描到整个表的末尾, 而不是在@vectorIndex1处停下来. 以下测试代码, 有兴趣的人可以拿去自己玩:

推荐整理分享多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序),希望有所帮助,仅作参考,欢迎阅读内容。

多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序)

文章相关热门搜索词:多列索引和联合索引,多列复合索引的作用,复合索引顺序,单列索引和复合索引,多个列上创建复合索引,单列索引和复合索引,多列复合索引的作用,复合索引最多几个字段,内容如对您有帮助,希望把文章链接给更多的朋友!

sqlserver索引的原理及索引建立的注意事项小结 聚集索引,数据实际上是按顺序存储的,数据页就在索引页上。就好像参考手册将所有主题按顺序编排一样。一旦找到了所要搜索的数据,就完成了这

SQL Server数据库入门学习总结 一图胜十言:SQLServer数据库总结一个大概的总结经过一段时间的学习,也对数据库有了一些认识。数据库基本是由表,关系,操作组成;对于初学者首

sqlserver 索引的一些总结 1.1.1摘要如果说要对数据库进行优化,我们主要可以通过以下五种方法,对数据库系统进行优化。1.计算机硬件调优2.应用程序调优3.数据库索引优化4.SQL

标签: 复合索引顺序

本文链接地址:https://www.jiuchutong.com/biancheng/348160.html 转载请保留说明!

上一篇:SQL语句分组获取记录的第一条数据的方法(sql实现分组查询的短语)

下一篇:sqlserver索引的原理及索引建立的注意事项小结(sqlserver 索引)

  • 股东转让股权公司如何做账
  • 用于维修安装服装的材料
  • 营业执照备案需要什么资料
  • 个人收取借款利息增值税
  • 自己打印的机票怎么退票
  • 生活服务费发票 经营范围
  • 小规模纳税人销售收入会计分录
  • 固定资产减少当月
  • 净收益营运指数大于1说明什么
  • 企业注销清算方案
  • 承租人融资租赁设备长期应付款包括租赁资产担保余值
  • 小规模无进项发票,需要开1%专票,税点是多少
  • 红字发票账务处理摘要
  • 专票红冲后的账务处理
  • 财务物料消耗都有哪些
  • 软件企业用退税吗
  • 支票遗失要怎么补办
  • 如何对投资收益进行会计处理
  • 期间损益结转怎么结转
  • 如何恢复微信语言聊天
  • 鸿蒙系统怎样关闭音乐
  • 计提当月电费账务处理
  • 公司租房中介费能报销吗
  • backupnotify.exe是什么文件的进程 backupnotify进程安全吗
  • 认缴出资额和实缴出资额的时间
  • 小规模纳税人缴纳增值税怎么算
  • 结转消费税的会计分录
  • PHP:apache_get_modules()的用法_Apache函数
  • 金融企业呆账核算流程
  • 单位交社保是不是比个人交社保以后退休金要多
  • 小米mini路由器mesh
  • php autoloader
  • php 重写 重载
  • 交易性金融资产包括哪些项目
  • 脐橙产业可行性报告
  • 常用的几种布局格式
  • 以权益结算的股票
  • 计算所得税不得扣除的税金
  • XHProf报告字段含义的解析
  • 固定资产备抵科目怎么填
  • 在php中提供了什么函数用于删除数组中的元素
  • 红字发票进项转出当期
  • api接口应用举例
  • 预缴2%
  • ps打不了字只显示一个点怎么办
  • websocket前端vue
  • 增值税进项税额计算公式
  • 劳务报酬什么情况下可以退税
  • 应付利息如何结转
  • python中的元组
  • 支付宝支付高速公路发票怎么打印
  • 营业执照注销要钱吗
  • 一般纳税人接受捐赠的固定资产,捐赠方提供了有关凭证
  • 不征税收入与免税收入的区别是什么
  • 季节性停工损失计入存货成本吗
  • 加计减免其他收入怎么填
  • 公司注销其他应付款法人借款
  • 勾选通行费发票后如何做分录
  • 固定资产清理的税率是多少
  • 房地产开发企业销售自行开发的房地产项目
  • 怎样计算加班工资?
  • 设置和使用电子技术监控设备收集信息
  • win2003开启远程桌面
  • 重装系统要注意哪些
  • os x10.8.5
  • 修改注册表命令
  • linux常见的启动方式
  • linux系统怎么弄
  • node.js详解
  • nodejs.
  • [置顶]bilinovel
  • JavaScript replace(rgExp,fn)正则替换的用法
  • jquery keydown
  • 修复硬盘
  • auto.js获取剪切板内容
  • win7怎么装python3.8
  • 三证合一后还有税务登记证吗?
  • 当前税务干部队伍不足
  • 工会经费少申报一个月可以下个月补上吗
  • 成品油进货
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设