本文共 1625 字,大约阅读时间需要 5 分钟。
数据库优化学习(一)
现有一个名为 Orders
的表,包含字段 OrderId
、UserId
、CreateDate
、TotalMoney
和 OrderType
。目前该表没有主键和其他索引。为了查询指定日期的订单数量,并返回 OrderId
、UserId
、TotalMoney
三个字段的数据,我们可以使用以下查询语句:
SELECT OrderId, UserId, TotalMoneyFROM OrdersWHERE CreateDate = '2012-12-17 14:59:53.463';
在执行上述查询时,观察到执行计划显示表扫描(Table Scan)。分析表的数据存储结构可知,该表采用堆存储形式。由于没有索引,查询会逐行检查表数据,评估 CreateDate
这个条件是否为真,从而返回满足条件的行数据。
此时,扫描表操作会涉及表中所有数据行,不管是否满足条件,因此其开销与表的数据量成正比。如果表数据量较少,或者满足条件的数据行比例较大,这样的执行计划是有效的。但如果表数据量较大,而满足条件的数据行比例较小,则会产生大量不必要的数据页和行的I/O开销。
为了优化查询性能,我们可以为表 Orders
创建一个聚集索引:
CREATE CLUSTERED INDEX Orders_OrderId_idx ON Orders(OrderId);
此时,表的数据存储将采用 B-Tree 结构。执行查询时,执行计划显示聚集索引扫描(Clustered Index Scan),取代了之前的表扫描。聚集索引与数据存储在一起,决定了表数据的物理存储顺序。一个表只能有一个聚集索引,其叶子结点存储数据行。聚集索引扫描时,直接访问索引页,而索引页存储整个表的数据副本。通过聚集索引找到记录时,可以直接获取相关列的值。
接下来,我们可以为 CreateDate
字段创建一个非聚集索引:
CREATE NONCLUSTERED INDEX Orders_CreateDate_idx ON Orders(CreateDate);
此时,执行计划显示非聚集索引查找(Nonclustered Index Seek)和检查找(CheckNext)两部分。非聚集索引存储在 B-Tree 中,叶子结点存储记录的 CreateDate
值。非聚集索引查找会通过索引页找到满足条件的记录,然后通过行定位符(RID)访问表中的完整记录。
此时,执行计划中包含键查找(Key Seek)和检查找两部分。键查找通过聚集索引找到满足条件的记录,而检查找则通过非聚集索引查找满足条件的记录。由于查询需要返回 UserId
和 TotalMoney
两个字段,而这两个字段不在非聚集索引中,优化器需要通过行定位符再次访问表中的记录。
为了避免键查找和检查找的开销,我们可以修改非聚集索引,包含 UserId
和 TotalMoney
这两个字段:
CREATE NONCLUSTERED INDEX Orders_CreateDate_idx ON Orders(CreateDate)INCLUDE (UserId, TotalMoney);
此时,执行计划显示非聚集索引查找直接访问满足条件的记录,而无需再次通过行定位符访问表中的记录。
如果不创建聚集索引,而直接为 CreateDate
字段创建非聚集索引:
CREATE NONCLUSTERED INDEX Orders_CreateDate_idx ON Orders(CreateDate);
则执行计划显示行定位符查找(RID Seek),即通过行定位符直接访问满足条件的记录。这与之前的键查找和检查找方式相比,仅涉及单个迭代器。
综上所述,合理设计索引覆盖查询所需字段,可以显著优化查询性能,避免不必要的二次查找操作。通过优化索引设计,可以将 I/O 开销降到最低,从而提升数据库查询效率。
转载地址:http://haffk.baihongyu.com/