一文彻底搞懂Mysql索引优化

专属小彩蛋：前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站（前言 - 床长人工智能教程）

一、索引介绍

二、性能分析

三、查询优化

四、排序优化

五、关联查询优化

六、分组优化

七、慢查询日志

一、索引介绍

（1）什么是mysql的索引

mysql官方对于索引的定义：索引是帮助mysql高效获取数据的数据结构。mysql在存储数据之外，数据库系统中还维护着满足特定查找算法的的数据结构，这些数据结构以某种引用（指向）表中的结构，这样我们就可以通过数据结构上实现的高级查找算法来快速找到我们想要的数据。而这种数据结构就是索引。

简单理解为“排好序的可以快速查找数据的数据结构”。

（2）索引数据结构

下图就是一种可能的二叉树的索引方式：

二叉树数据结构的弊端：当极端情况下，数据递增插入时，会一直向右插入，形成链表，查询效率会降低。

MYSQL中常用的索引数据结构有BTree索引（myisam普通索引）B+Tree索引（Innodb普通索引），hash索引（memory存储索引）等等。

（3）索引优势

提高数据检索的效率，降低数据库的IO成本。通过索引对数据进行排序，降低数据排序的成本，降低了cpu的消耗。

（4）索引劣势

索引实际上也是一张表，保存了主键和索引的字段，并且指向实体表的记录，所以索引也是需要占用空间的，在索引大大提高查询速度的同时，却会降低表的更新速度，在对表进行数据增删改的同时，mysql不仅要更新数据，还需要保存一下索引文件，每次更新添加了的索引列的字段，都会去调整因为更新带来的减值变化后的索引的信息。

（5）索引使用场景

哪些情况推荐建立索引？

主键自动建立唯一索引
频繁作为查询条件的字段应该创建索引（where后面的语句）
查询中与其他表关联的字段，外键关系建立索引
多字段查询下倾向创建组合索引
查询中排序的字段，排序字段若通过索引去访问将大大提高排序速度
查询中统计或者分组字段

哪些情况不推荐建立索引？

表记录太少
经常增删改的表
where条件里用不到的字段不建立索引

（6）索引分类

主键索引(primary key)
唯一索引(unique)
单值索引(index)
复合索引

二、性能分析

（1）mysql常见瓶颈

sql中对大量数据进行比较，关联，排序，分组时cpu的瓶颈。

实例内存满足不了缓存数据或排序等需要，导致产生大量的物理IO，查询数据时扫描过多数据行，导致查询效率低。

（2）Explain 执行计划

使用Explain关键字可以模拟优化器执行sql查询语句，从而知道mysql是如何处理sql语句的，可以用来分析查询语句或是表的结构的性能瓶颈。其作用：

表的读取顺序
哪些索引可以使用
数据读取操作的操作类型
哪些索引被实际使用
表之间的引用
每张表有多少行被优化器查询

Explain 关键字使用起来比较简单： explain + SQL语句

如下所示，我们查看一个多表根据id关联的sql语句执行计划。

（3）Explain 重要字段名

id：select查询的序列号，表示查询中执行select子句或操作表的顺序。

id相同时，执行顺序由上至下。
id不同，如果是子查询，id的序号会递增，id值越大优先级越高，则先被执行。
id相同和不同都存在时，id相同的可以理解为一组，从上往下顺序执行，所有组中，id值越大，优先级越高越先执行。

select_type:询的类型，常见值有：

SIMPLE：简单的select查询，查询中不包含子查询或union。
PRIMARY: 查询中若包含任何复杂的子部分，最外层查询则被标记为Primary。
DERIVED: 在FROM列表中包含的子查询被标记为DERIVED(衍生)，mysql会递归执行这些子查询，把结果放在临时表里。
SUBQUERY: 在select或where列表中包含了子查询。

table：显示这一行的数据是关于哪张表的。

type：访问类型排序

System：表只有一行记录（等于系统表），这是const类型的特例，平时不会出现，这个也可以忽略不计。示例：

Const：表示通过索引一次就找到了，const用于比较primary key或者unique索引，因为只匹配了一行数据，所以很快，如将主键置于where列表中，mysql就能将该查询转换为一个常量。示例：

eq_ref: 唯一性索引扫描，对于每个索引建，表中只有一条记录与之匹配，常见于主键或者唯一索引扫描, 常用于联表查询，示例:

ref：非唯一性索引扫描，返回匹配某个单独值的所有行，本质上也是一种索引访问，它返回所有匹配某个单独值的行，然而，它可能会找到多个符合条件的行，所以它应该属于查找和扫描的混合体。示例：

range：只检索给定范围的行，使用一个索引来选择行，key列显示使用了哪个索引一般就在你的where语句中出现了between，<，>，in等的查询这种范围扫描索引扫描比全表扫描要好，因为它只需要开始于索引的某一点，结束于另一点，不用扫描全部索引。示例:

index: full index scan,index与all 区别为index类型只遍历索引树，这通常比all快，因为索引文件通常比数据文件小，也就是说虽然all和index都是读全表，但index是从索引中读取的，而all是从硬盘中读取的。示例：由于t1表只有id和content两个字段，并且id，content 都建立了索引，所以直接从索引文件读取数据。
all： full table scan，将遍历全表来找到匹配的行。