位置: 编程技术 - 正文

多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序)

编辑:rootadmin
然而,微软sql server在处理这类索引时,有个重要的缺陷,那就是把本该编译成索引seek的操作编成了索引扫描,这可能导致严重性能下降 举个例子来说明问题,假设某个表T有索引 ( cityid, sentdate, userid), 现在有个分页列表功能,要获得大于某个多列复合索引V0的若干个记录的查询,用最简单表意的方式写出来就是 V >= V0, 如果分解开来,就是: cityid > @cityid0 or (cityid = @cityid0 and (sentdate > @sentdate0 or (sentdate = @sentdate0 and userid >= @userid0))), 当你写出上述查询时,你会期待sql server会自动的把上述识别为V >= V0类型的边界条件,并使用index seek操作来实施该查询。然而,微软的sql server (版)有一个重要缺陷(其他的sql server如何还不得知), 当它遇到这样sql时,sql server就会采用index scan来实施,结果是您建立好的索引根本就没有被使用,如果这个表的数据量很大,那所造成的性能下降是非常大的。 对于这个问题,我曾经提交给微软的有关人士,他们进一步要求我去一个正式的网站上去提交这个缺陷,我懒得去做。 不过,对这个缺陷,还是有个办法能够绕过去的,只要把上面给出的条件变变形,sql server还是能够变回到是用index seek, 而不是低性能的index scan. 具体请看我的英文原文吧(对不起了, 我一旦写了中文,就不想翻成英文,反过来也一样, 估计大家英文都还可以,实在不行的就看黑体部分吧, ): The seek predicate of the form "x > bookmark_of_x" is needed in paging related query. The compiler has no difficulty to parse it correctly if x is a single column index, or two columns index, however, if x is a three columns index or more, then the compiler will have a hard time to recognize it. This failure will result in that the seek predicate ended up in residue predicate, which results in a much worse execution plan. To illustrate the point, take a example, Create table A( a int, b int, c int, d float, primary key (a, b, c)) now check the plan for the query: select c, d from A where (a> or a= and (b > or b = and c > )) you can see a table scan op is used, and the Where clause ended up in residue predicate. However, if you rewrite the query in an equivalent form: select c, d from A where a> or a= and b > or a= and b= and c > Then the compiler can choose an index seek op, which is desired. The problem is, the compiler should be able to recognize the first form of seek predicate on multiple columns index, it saves the user from having to pay extra time to figure out a get-around, not to mention the first form is a more efficient form of same expression. 上面的问题,可以说是部分的绕过去了,但是,也有绕不过的时候,接着看下面一段: It looks like that sql server lacks a consept of vector bookmark, or vector comparison or whatever you like to call it. The workaround is not a perfect workaround. If sql server were to understand the concept of vector bookmark, then the following two would be the same in execution plan and performance: 1. select top(n) * from A where vectorIndex >= @vectorIndex 2. select * from A where vectorIndex >= @vectorIndex and vectorIndex <=@vectorIndexEnd -- @vectorIndexEnd corresponds to the last row of 1. However, test has shown that, the second statement takes far more time than the first statement, and sql server actually only seek to the begining of the vector range and scan to the end of the whole Index, instead of stop at the end of the vector range. Not only sql server compile badly when the vector bookmark has 3 columns, test has shown that even with as few as 2 columns, sql serer still can not correctly recognize this is actually a vector range, example: 3. select top () a, b, c, d from A where a> or a= and b > 4. select a, b, c, d from A where (a> or a= and b > ) and (a< or a= and b <= ), 上面两个查询实质相同(表中的数据刚好如此),并且给出同业的结果集,但是,3比4的速度要快的多,如果去看execution plan也证明3确实应当比4快. 也就是说, 即使在索引vectorIndex只含两列的情况下, sql server也无法正确的理解范围表达式 @vectorIndex0 < vectorIndex < @vectorIndex1, 它能把前半部分正确的解读为seek, 但是, 后半部分无法正确解读, 导致, sql server会一直扫描到整个表的末尾, 而不是在@vectorIndex1处停下来. 以下测试代码, 有兴趣的人可以拿去自己玩:

推荐整理分享多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序),希望有所帮助,仅作参考,欢迎阅读内容。

多列复合索引的使用 绕过微软sql server的一个缺陷(复合索引顺序)

文章相关热门搜索词:多列索引和联合索引,多列复合索引的作用,复合索引顺序,单列索引和复合索引,多个列上创建复合索引,单列索引和复合索引,多列复合索引的作用,复合索引最多几个字段,内容如对您有帮助,希望把文章链接给更多的朋友!

sqlserver索引的原理及索引建立的注意事项小结 聚集索引,数据实际上是按顺序存储的,数据页就在索引页上。就好像参考手册将所有主题按顺序编排一样。一旦找到了所要搜索的数据,就完成了这

SQL Server数据库入门学习总结 一图胜十言:SQLServer数据库总结一个大概的总结经过一段时间的学习,也对数据库有了一些认识。数据库基本是由表,关系,操作组成;对于初学者首

sqlserver 索引的一些总结 1.1.1摘要如果说要对数据库进行优化,我们主要可以通过以下五种方法,对数据库系统进行优化。1.计算机硬件调优2.应用程序调优3.数据库索引优化4.SQL

标签: 复合索引顺序

本文链接地址:https://www.jiuchutong.com/biancheng/348160.html 转载请保留说明!

上一篇:SQL语句分组获取记录的第一条数据的方法(sql实现分组查询的短语)

下一篇:sqlserver索引的原理及索引建立的注意事项小结(sqlserver 索引)

  • 非企业员工可以报销差旅费吗
  • 什么是商业汇票和银行汇票
  • 汇算清缴时房企毛利额有差异如何调整
  • 收到失业金返还什么意思
  • 营业外收入做销项税调整
  • 发货就要开票吗是真的吗
  • 公司业务章需要报备吗
  • 个人自产自销农产品免税政策
  • 土地增值税清算的条件
  • 合并报表长期股权投资怎么算
  • 有留抵增值税怎么做账
  • 公共电话亭的话费收入如何做税务处理呢?
  • 无偿捐赠设备该如何做账务处理呢?
  • 事业单位利息收入
  • 什么是差额增收
  • 管理费用中的水费电费在纳税申报表A104000
  • 制造费用分配的的标准是什么?
  • 商业现金折扣计算
  • 长期股权投资采用成本法核算,被投资单位实现的净利润
  • 固定资产清理汇算清缴如何反应
  • 出口退税系统怎么导入数据
  • 员工住院押金会计处理
  • 公司设备租赁给客户怎么做科目
  • 其它权益工具投资处置时其他综合收益转那
  • linux杀死服务
  • 财政补助收入的账务处理
  • manager's office是什么意思
  • php数组函数输出《咏雪》里有多少"片"字
  • gcasSWUpdater.exe是什么进程 有什么作用 gcasSWUpdater进程查询
  • php精彩编程200例
  • 补缴当年增值税和滞纳金如何入账
  • 什么叫奖励旅游
  • web转义字符
  • wordpress恢复主题默认设置
  • 场地租赁费需要计提吗
  • 未取得专用发票详细原因怎么写
  • 公司亏损注销了怎么处理
  • u-net优点
  • 谷歌浏览器被hao123锁定改不了
  • 多模手机
  • 深入全面剖析自己
  • slf4j、log4j2及logback使用
  • 售后租回交易形式是什么
  • php fgetc
  • mongodb win7
  • 进项税额计提是哪个科目
  • 应交税费账户的用途和结构是怎样的
  • 现金流量表算财务报表吗
  • 消费税和购置税系重复征税
  • 先收票后收货
  • 资本化期间专门借款利息费用需将
  • 将外购商品作为非货币
  • 土地管理费属于什么费用
  • 公司市场部门有什么职位
  • 小规模企业应交税费分录
  • 对公账户给私人账户转账,几天到账
  • 交易性金融资产的入账价值
  • sqlserver数据导出导入脚本
  • haozipsvc.exe是什么
  • 删除 ubuntu
  • centos 安装chia
  • wrme.exe是什么
  • winfs.exe - winfs是什么进程
  • ubuntu20.04怎么用
  • linux收发邮件
  • linux虚拟机怎么查看目录
  • js让按钮不能点击
  • android开源软件
  • 网页shell命令
  • bat运行完后不退出
  • python创建二维数据表
  • opengl编译
  • 批处理命令教程
  • python3gui
  • android基础入门教程
  • unity androidx
  • NGUI之UITexture
  • 广西增值税发票查询平台
  • 税务绩效工作存在的问题
  • 西安代驾平台有哪些
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设