位置: 编程技术 - 正文

索引的原理及索引建立的注意事项(索引的基本原则)

编辑:rootadmin

聚集索引,数据实际上是按顺序存储的,数据页就在索引页上。就好像参考手册将所有主题按顺序编排一样。一旦找到了所要搜索的数据,就完成了这次搜索,对于非聚集索引,索引是安全独立于数据本身结构的,在索引中找到了寻找的数据,然后通过指针定位到实际的数据。

SQL Server中的索引使用标准的B-树来存储他们的信息,如下图所示,B-树通过查找索引中的一个关键之来提供对于数据的快速访问,B-树以相似的键记录聚合在一起,B不代表二叉(binary),而是代表balanced(平衡的),而B-树的一个核心作用就是保持树的平衡。同伙向下遍历这棵树以找到一个数值并定位记录。因为树是平衡的,所以寻找任何记录都只需要等量的资源,而且获取的速度总是一致的—因为从根索引叶索引都具有相同的深度。索引的中间层次是根据表的行数一级索引行的大小而变化的,如果使用一个较长的键(KEY)来创建索引,一个分页上就只容纳较少的条目,因而索引就需要更多分页(或者说更多层),页越多那么查找就需要话费相对较长的时间来找到所需要的信息,索引就可能不太有用了。聚集索引聚集索引的叶级别不仅包含了索引键,还包含了数据页。另一种说法数据本身也是聚集索引的一部分,聚集索引基于键值保持表中的数据有序,表中的数据页是通过一个被称作页链(page chain)的双向链接表来维护的,由于实际的数据页的页链只能按一种方式排序,因此一张表只能拥有一个聚集索引。这里可能有一个误区,有很多介绍SQL Server索引的文档会告诉读者:聚集索引按照排序顺序(sorted order)物理地存储数据。如果以为物理存储就是磁盘本身的话就会产生误解。试想如果聚集索引需要按照特定顺序在实际的磁盘上维护数据的话,那么任何修改操作都将会产生相当高昂的代价。当一个页变满了需要一分为二的时候,所有后续页面上的数据都必须向后移动。聚集索引中的排序顺序(sorted order)仅仅表示数据页链在逻辑上是有序的。大多数表都应该需要一个聚集索引。优化器非常倾向于采用聚集索引,因为聚集索引能够直接在叶级别找到数据。由于定义了数据的逻辑顺序,聚集索引能够特别快的访问针对范围值的查询,查询优化器能够发现只有某一段范围的数据页需要扫描。非聚集索引对于非聚集索引,叶级别不包含全部的数据。除了键值之外,每个叶级别(树的最底层)中的索引行包含了一个书签(bookmark),告诉SQL Server可以在那里找到与索引键相应的数据行。一个书签可能有两种形式。如果表上存在聚集索引,书签就是相应的数据行的聚集索引键。如果彪是堆(heap)结构,书签就是一个行表示(row identifier,RID),以“文件号:页号:槽号”的格式来定位实际的行。主键(PRIMARY KEY)与聚集索引(CLUSTER INDEX)严格来说,主键与聚集索引没有任何关系,如果要说有话,那就是表中没有聚集索引的时候,创建的主键默认就是聚集索引(除非有特别设置为NOCLUSTER)。在主键与聚集索引的处理方面,注意以下事项:1、主键不与聚集索引分离2、聚集索引键列尽量避免使用int之外的数据类型3、尽量避免使用复合主键创建索引时的注意事项1、始终包含聚集索引当表中不包含聚集索引时,表中的数据是无序的,这会降低数据检索效率。即使通过索引缩小了数据检索的范围,但由于数据本身是无序的,当从表中提取实际数据时,会产生频繁的定位问题,这也使得SQL Server基本上不会使用无聚集索引表中的索引来检索数据。2、保证聚集索引唯一由于聚集索引是非聚集索引的行定位器,如果它不唯一,则会使行定位器中包含辅助数据,同时也导致从表中提取数据时,需要借助行定位器中的辅助数据来定位,这会降低处理效率。3、保证聚集索引最小每个聚集键值都是所有非聚集索引的叶结点记录,它越小,意味着每个非聚集索引的索引叶包含的有效数据越多,这对于提升索引效率很有好处。4、覆盖索引覆盖索引是指索引中的列包含了数据处理中涉及的所有列,覆盖索引相当原始表的一个子集,由于这个子集中包含了数据处理涉及的所有列,因此操作这个子集就可以满足数据处理需要。一般而言,如果大多数处理都只涉及某个大表的某些列,可以考虑为这些列建立覆盖索引。覆盖索引的建立方法是将要包含的列中的关键列做为索引键列,将其他列做为索引的包含列(使用索引创建语句中的INCLUDE子句)。5、适量的索引当数据发生变化时,SQL Server会同步维护相关索引中的数据,过多的索引会加影响数据变更的处理效率。因此,只应该在经常使用的列上建立索引。适量的索引还体现在对索引列的组合方式的控制上。例如,如果有两个列col1和col2,这两个列的组合会产生三种使用情况:单独使用col1、单独使用col2及同时使用col1和col2。如果有为每种情况都建立索引,则需要建立三个索引。但也可以只建立一个复合索引(col1, col2),这样能够依次满足col1+col2、col1、col2这三种方式的查询,其中,col2利用这个查询会比较勉强(还要配合单独的统计),可以视实际情况确定是否需要为col2建立单独的索引。特别注意:不要建立重复索引,目前最常见的重复索引是单独为某个列建立主键和聚集索引与直接从表中提取数据相比,根据索引检索数据,多了一个索引检索的过程,这个过程要求能够尽量缩小数据检索范围,并且使用最少的时间,这样才能真正保证能够通过索引提高数据检索效率。实现上述目的,对于索引键列的选择,应该遵循如下原则:选择性原则选择性是满足条件的记录占总记录数的百分比,这个比率应该尽可能低,这样才能保证通过索引扫描后,只需要从基础表提取很少的数据。如果这个比率偏高,则不应该考虑在此列上建立索引。数据密度原则数据密度是指列值唯一的记录占总记录数的百分比,这个比率越高,则说明此列越适合建立索引。在考虑数据密度的时候,还要注意数据分布的问题,只有经常检索的密度高时,才适合建立索引。例如,如果一张表有万记录,虽然某个列不重复的记录有9万条,但如果经常检索的2万条记录,其不重复的列值才几十条的话,这个列是不太适合建立索引的。另一种情况是,整体数据密度不大,但经常检索的数据的密度大,例如订单的状态,一般来说,订单的状态就几种,但已经Close的订单往往占整个数据的绝大部分,但数据处理的时候,基本上都是检索未Close的订单,这种情况下,为订单的状态列建立索引还是比较有效的(SQL Server 中,可以为这种列建立具有更佳效果的筛选索引)。6、索引键列大小一般不宜为超过Byte的列建立索引。7、复合索引键列顺序在索引中,索引的顺序主要由索引中的每一个键列确定,因此,对于复合索引,索引中的列顺序是很重要的,应该优先把数据密度大,选择性列,存储空间小的列放在索引键列的前面。

推荐整理分享索引的原理及索引建立的注意事项(索引的基本原则),希望有所帮助,仅作参考,欢迎阅读内容。

索引的原理及索引建立的注意事项(索引的基本原则)

文章相关热门搜索词:索引的基本原则,索引的用法和原理,索引的原理及索引结构,索引的工作原理及种类,索引的基本原理,索引的原理和优缺点,索引的原理是什么,索引的原理是什么,内容如对您有帮助,希望把文章链接给更多的朋友!

sqlserver数据库主键的生成方式小结(sqlserver,mysql) 主键的生成方式主要有三种:一.数据库自动生成二.GUID三.开发创建严格讲这三种产生方式有一定的交叉点,其定位方式将在下面进行讲解。第一种方式

sqlserver主键设计的注意点 在设计主键的时候往往需要考虑以下几点:1.无意义性:此处无意义是从用户的角度来定义的。这种无意义在一定程度上也会减少数据库的信息冗余。常

SQL Server字符串切割函数 CREATEFUNCTIONfGetStrBySplit(@SourceVARCHAR(max),@IndexINT,@SplitCharVARCHAR(1))RETURNSvarchar(MAX)ASBEGINDECLARE@LenINTDECLARE@nINT=0DECLARE@ChIndexINTDECLARE@ResultVARCHAR(MAX)--获取总长度SET@L

标签: 索引的基本原则

本文链接地址:https://www.jiuchutong.com/biancheng/348153.html 转载请保留说明!

上一篇:SQL Server中使用Linkserver连接Oracle的方法(sql server 用法)

下一篇:sqlserver数据库主键的生成方式小结(sqlserver,mysql)(sqlserver的主数据库是什么)

  • 免税进账转出怎么填表
  • 银行存款出现负数算不算违规
  • 工会建账选择哪个科目好
  • 增值税专用发票是干什么用的
  • 企业所有者权益科目有哪些
  • 电子发票冲红是怎么回事
  • 事业单位结转资金和结余资金区别
  • 公司账户没有钱怎么办
  • 营改增后建安企业账务处理
  • 企业赔款可以抵税吗
  • 企业现金股利的支付能力,在很大程度
  • 企业网上申报国税流程
  • 采购合同含税未税合同模板
  • 保险费可以抵扣嘛
  • 简并增值税税率政策解读
  • 电子银行承兑汇票有风险吗
  • 房地产公司靠什么赚钱
  • 税收强制执行措施包括哪些
  • 借款利息可以入账吗
  • 专票遗失需要怎么处理?
  • 给员工发放奖励计入
  • 企业销售费用支出怎么算
  • 抵押贷款逾期怎么处理抵押物
  • 盘盈现金计入当期损益
  • 上月计提费用下月一定要冲回吗
  • 权益净利率是什么意思啊
  • Linux /bin, /sbin, /usr/bin, /usr/sbin 区别
  • 出口零申报步骤
  • dl是什么文件
  • 此设备某些文件可能存在问题
  • php怎么与mysql连接
  • 专项储备计提和使用
  • json解析格式
  • 机器视觉 machine
  • lspci命令显示
  • 取得进项税发票什么时期内可以抵扣
  • 天然气零售企业
  • 待处理财产损益期末结转到哪里
  • 申报表跟账不一致,如何调整账
  • python多线程处理excel
  • 固定资产盘亏要改变资产原值吗
  • 出售金融资产计入
  • 结算备付金账户是什么帐户
  • 管理费用漏记了跨年调整
  • pe市盈率法
  • 住宿费记入成本会计分录
  • 增值税发票红冲和作废的区别
  • 一般纳税人注销公司流程2023
  • 金蝶银行存款日记账
  • 会计核算的主要环节
  • sql外连接
  • windows版微信能运行小程序吗
  • ubuntu20.04常用软件
  • 系统备份恢复系统
  • ubuntu安装lnmp环境
  • 电脑开机时进入安全模式怎么退出
  • windows7问题解决方案
  • win7系统怎么删除
  • win 超级终端
  • 如何设置访问共享文件夹
  • xp系统停止服务了还能用吗
  • windows102021年更新
  • linux date-u
  • cocos creator特效制作
  • android如何运行项目
  • shell中的-le
  • windows清除远程登录记录
  • c# 抽象类的作用
  • jquery实现隔行变色的分享特效页面
  • shell脚本语句
  • shell脚本中获取日期
  • jquery教程chm
  • python的排序方法
  • 国家税务局内蒙古税务
  • 广东高速公路电子发票服务来平台
  • 广东省电子税务局电话
  • 江西省联考成绩查询系统入口官网
  • 2021年房产税收新政
  • 买新车还要交套餐费吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设