专属小彩蛋:前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站(前言 - 床长人工智能教程)

目录
一、索引介绍
二、性能分析
三、查询优化
四、排序优化
五、关联查询优化
六、分组优化
七、慢查询日志
一、索引介绍
(1)什么是mysql的索引
mysql官方对于索引的定义:索引是帮助mysql高效获取数据的数据结构。mysql在存储数据之外,数据库系统中还维护着满足特定查找算法的的数据结构,这些数据结构以某种引用(指向)表中的结构,这样我们就可以通过数据结构上实现的高级查找算法来快速找到我们想要的数据。而这种数据结构就是索引。
简单理解为“排好序的可以快速查找数据的数据结构”。
(2)索引数据结构
下图就是一种可能的二叉树的索引方式:

二叉树数据结构的弊端:当极端情况下,数据递增插入时,会一直向右插入,形成链表,查询效率会降低。
MYSQL中常用的索引数据结构有BTree索引(myisam普通索引)B+Tree索引(Innodb普通索引),hash索引(memory存储索引)等等。
(3)索引优势
提高数据检索的效率,降低数据库的IO成本。通过索引对数据进行排序,降低数据排序的成本,降低了cpu的消耗。
(4)索引劣势
索引实际上也是一张表,保存了主键和索引的字段,并且指向实体表的记录,所以索引也是需要占用空间的,在索引大大提高查询速度的同时,却会降低表的更新速度,在对表进行数据增删改的同时,mysql不仅要更新数据,还需要保存一下索引文件,每次更新添加了的索引列的字段,都会去调整因为更新带来的减值变化后的索引的信息。
(5)索引使用场景
哪些情况推荐建立索引?
- 主键自动建立唯一索引
- 频繁作为查询条件的字段应该创建索引(where后面的语句)
- 查询中与其他表关联的字段,外键关系建立索引
- 多字段查询下倾向创建组合索引
- 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
- 查询中统计或者分组字段
哪些情况不推荐建立索引?
- 表记录太少
- 经常增删改的表
- where条件里用不到的字段不建立索引
(6)索引分类
- 主键索引(primary key)
- 唯一索引(unique)
- 单值索引(index)
- 复合索引
二、性能分析
(1)mysql常见瓶颈
sql中对大量数据进行比较,关联,排序,分组时cpu的瓶颈。
实例内存满足不了缓存数据或排序等需要,导致产生大量的物理IO,查询数据时扫描过多数据行,导致查询效率低。
(2)Explain 执行计划
使用Explain关键字可以模拟优化器执行sql查询语句,从而知道mysql是如何处理sql语句的,可以用来分析查询语句或是表的结构的性能瓶颈。其作用:
- 表的读取顺序
- 哪些索引可以使用
- 数据读取操作的操作类型
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
Explain 关键字使用起来比较简单: explain + SQL语句
如下所示,我们查看一个多表根据id关联的sql语句执行计划。

(3)Explain 重要字段名

id:select查询的序列号,表示查询中执行select子句或操作表的顺序。
- id相同时,执行顺序由上至下。
- id不同,如果是子查询,id的序号会递增,id值越大优先级越高,则先被执行。
- id相同和不同都存在时,id相同的可以理解为一组,从上往下顺序执行,所有组中,id值越大,优先级越高越先执行。
select_type:询的类型,常见值有:
- SIMPLE: 简单的select查询,查询中不包含子查询或union。
- PRIMARY: 查询中若包含任何复杂的子部分,最外层查询则被标记为Primary。
- DERIVED: 在FROM列表中包含的子查询被标记为DERIVED(衍生),mysql会递归执行这些子查询,把结果放在临时表里。
- SUBQUERY: 在select或where列表中包含了子查询。
table:显示这一行的数据是关于哪张表的。
type:访问类型排序

- System:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,这个也可以忽略不计。示例:

- Const:表示通过索引一次就找到了,const用于比较primary key或者unique索引,因为只匹配了一行数据,所以很快,如将主键置于where列表中,mysql就能将该查询转换为一个常量。示例:

- eq_ref: 唯一性索引扫描,对于每个索引建,表中只有一条记录与之匹配,常见于主键或者唯一索引扫描, 常用于联表查询,示例:

- ref:非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体。示例:

- range:只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引一般就在你的where语句中出现了between,<,>,in等的查询这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,结束于另一点,不用扫描全部索引。示例:

- index: full index scan,index与all 区别为index类型只遍历索引树,这通常比all快,因为索引文件通常比数据文件小,也就是说虽然all和index都是读全表,但index是从索引中读取的,而all是从硬盘中读取的。示例:由于t1表只有id和content两个字段,并且id,content 都建立了索引,所以直接从索引文件读取数据。

- all: full table scan,将遍历全表来找到匹配的行。
从最好到最差依次为:system> const > eq_ref> ref> range> index> all 。 一般来说, 最好保证查询能达到range级别,最好能达到ref级别以上。
possible_keys: 显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上如果存在索引,则该索引将会被列出来,但不一定会被查询到实际使用上。

key: 查询中实际使用的索引,如果是null,则没有使用索引。
当 查询条件改为 is not null 时,索引失效,则possible_keys 和 key 就不一致了。

ref :显示索引的哪一列被使用了,哪些列或常量被用于查找索引列上的值。

rows:显示mysql认为它执行查询时必须检查的行数,一般越少越好。
- extra: 一些常见的重要的额外信息。
- Using filesort:mysql 无法利用索引完成的排序操作称为“文件排序”。(代表排序字段没有使用索引,效率较低)

- Using temporary: mysql在对查询结果排序时使用临时表,常见于排序order by 和分组查询 group by。

- Using index:表示索引被用来执行索引键值的查找,避免访问了表的数据行,效率不错(代表查询的字段都是从索引文件获取到的)示例:从索引文件获取

未从索引文件获取

- Using where:表示使用了where过滤。

三、查询优化
示例前提:我们建了一个( sname ,age,score) 的组合索引。演示失效的场景。
(1)索引失效
- 最佳左前缀法则:如果索引了多列,要遵循最左前缀法则,指的是查询从索引的最左前列开始并且不跳过索引中的列。示例:我们建了一个 sname ,age,score 的组合索引,当我们执行如下四个前三个sql 索引生效,第四个sql其实只有sname索引生效,如果执行的sql为:

select * from students where age = 22; 则索引完全失效,没有符合最左匹配原则。
- 不在索引列上做任何计算,函数操作,会导致索引失效而转向全表扫描。

- 存储引擎不能使用索引中范围条件右边的列,示例:只有sname 和 age的索引生效,score索引并没有用到

- mysql在使用不等于时无法使用索引会导致全表扫描

- is null可以使用索引,但是is not null 无法使用索引。

- like 以通配符开头会使索引失效导致全表扫描。

- 字符串不加单引号索引会失效

- 使用 or 连接时索引失效

总结:假设index(a,b,c)复合索引:注意or 不会生效,and 会自动调整顺序为最左前列。


建议:
- 对于单值索引,尽量选择针对当前查询字段过滤性更好的索引,
- 对于组合索引,当前where查询中过滤性更好的字段在索引字段顺序中位置越靠前越好,尽量选择能够包含在当前查询中where子句中更多字段的索引,尽量通过分析统计信息和调整查询的写法来达到选择合适索引的目的。
四、排序优化
- 尽量避免使用Using filesort的方式排序
- order by 语句使用索引最左前列或使用where子句与order by 子句条件组合满足索引最左前列。
- where 子句中如果出现索引范围查询会导致order by 索引失效

五、关联查询优化
内连接时,mysql会自动把小结果集的选为驱动表,所以大表的字段最好加上索引,左外连接时,左表会全表扫描,所以右边大表字段最好加上索引,右外连接同理,最好保证被驱动表上的字段建立了索引。
class表为驱动表,book表为被驱动表,一般我们将数据量少的表作为驱动表,因为left join 或者 right join 时驱动表不可避免的需要全表扫描,

给book表的card字段建立索引后,再次测试

六、分组优化
和排序优化思路类似

七、慢查询日志
mysql 的慢查询日志是mysql 提供的一种日志记录,他用来记录在mysql 中响应时间超过阈值的语句,具体运行时间超过long_query_time值的sql,则会被记录到慢查询日志中。可以用它来查看哪些sql超过了我们最大忍耐时间值。
默认情况下,mysql数据库没有开启慢查询日志,需要手动设置参数。
查看是否开启:show variables like '%slow_query_log%'
开启日志:set global slow_query_log = 1;
查看超时的sql 记录 日志:mysql的数据文件夹下
5.5\Data\设备名称-slow.log
注意:非调优场景下,一般不建议启动该参数,慢查询日志支持将日志记录写入文件,开启慢查询日志会或多或少带来一定的性能影响。
专属小彩蛋:前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站(前言 - 床长人工智能教程)

















