在实际测试过程中对产品进行性能分析时,经常发现因缺少索引导致上层业务性能出现问题,甚至有的表一个索引都没有。
这种情况往往都是因为在设计表时,没有根据实际业务应用、数据体量等进行分析、设计。同时由于在产品开发阶段,由于开发、测试环节数据量少,索引的创建与否对于性能的影响并不明显,容易忽略其中性能风险。然而一旦发布到生产环境,随着时间推移,数据量、用户基数不断增加,暴露性能问题的风险也逐渐增大。
同时,索引创建并且用到了索引字段,但并不意味着真正使用了索引,本文主要从如何避免索引失效的角度,介绍SQL性能优化。
因索引失效,导致全表扫描的可能原因有以下几点:
- 索引列进行计算、函数、类型转换等操作。
- 索引列使用不等于,如!= 或<>。
- 索引列使用 IS NULL ,IS NOT NULL。
- 模糊查询LIKE 以通配符开头如,?。
- 索引列使用使用OR来连接条件。
- 索引列使用IN和NOT IN 。
- 类型错误,如字段NUM类型为varchar,WHERE条件用number,NUM = 1。
- WHERE子句和ORDER BY使用相同的索引,并且ORDER BY的顺序和索引顺序相同,并且ORDER BY的字段都是升序或者降序,否则不会使用索引。
- 复合索引不符合最佳左前缀原则或存在断点。
- 如果MYSQL评估全表扫描快于索引扫描,则不使用索引,一般数据量极少时,可能不会走索引。
- 索引被禁用,开启索引ALTER TABLE TESTOPS ENABLE KEYS 。
对于复合索引失效的可能原因有以下几点:
在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致。
同时,复合索引的生效原则是从前往后依次使用生效,如果中间某个索引没有使用,那么断点前面的索引部分起作用,断点后面的索引没有起作用,造成断点的原因一般有:
- 前边的任意一个索引没有参与查询,后面的不生效。
- 前边的任意一个索引失效,当前索引及后面全部不生效。
- 前边的任意一个索引字段参与的是范围查询,后面的不生效。
防止索引失效的优化方法
应尽量避免在 WHERE 子句中使用 != 或 <> 操作符,否则将导致引擎放弃使用索引而进行全表扫描。MySQL只有对以下操作符才使用索引:<,<=,=,>,>=,BETWEEN,IN,以及某些方式的模糊查询,如 LIKE 'a%' 。