项目中常用的MySQL优化你知道多少?

article/2025/11/6 5:45:03

项目中常用的MySQL优化

文章目录

  • 项目中常用的MySQL优化
  • 前言
  • 一、mysql优化是什么?
  • 二、优化步骤
    • 1.EXPLAIN
    • 2.SQL语句中IN包含的值不应太多
    • 3.SELECT语句务必指明字段名称
    • 4.如果排序字段没有用到索引,就尽量少排序
    • 5.如果限制条件中其他字段没有索引,尽量少用or
    • 6.尽量用union all代替union
    • 7.不使用ORDER BY RAND()
    • 8.区分in和exists, not in和not exists
    • 9.使用合理的分页方式以提高分页的效率
    • 10.分段查询
    • 11.不建议使用%前缀模糊查询
    • 12.避免在where子句中对字段进行表达式操作
    • 13.避免隐式类型转换
    • 14.对于联合索引来说,要遵守最左前缀法则
    • 15.必要时可以使用force index来强制查询走某个索引
    • 16.注意范围查询语句
    • 17.关于JOIN优化
  • 总结


前言

MySQL数据库服务:MySQL数据库服务是一种完全托管的数据库服务,可使用世界上最受欢迎的开源数据库来部署云原生应用程序。最全面的一组高级功能,管理工具和技术支持,可实现最高级别的MySQL可扩展性,安全性,可靠性和正常运行时间。


提示:以下是本篇文章正文内容,下面案例可供参考

一、mysql优化是什么?

在面对不够优化、或者性能极差的SQL语句时,我们通常的想法是将重构这个SQL语句,让其查询的结果集和原来保持一样,并且希望SQL性能得以提升。而在重构SQL时,一般都有一定方法技巧可供参考,今天来聊一下为什么要做MySQL优化,MySQL优化SQL的方法是什么?。

二、优化步骤

1.EXPLAIN

做MySQL优化,我们要善用 EXPLAIN 查看SQL执行计划。
下面来个简单的示例,标注(1,2,3,4,5)我们要重点关注的数据
在这里插入图片描述

type列,连接类型:一个好的sql语句至少要达到range级别。杜绝出现all级别
key列,使用到的索引名:如果没有选择索引,值是NULL。可以采取强制索引方式
key_len列,索引长度
rows列,扫描行数:该值是个预估值
extra列,详细说明:注意常见的不太友好的值有:Using filesort, Using temporary

针对type一般有几个级别

system:系统表,少量数据,往往不需要进行磁盘IO;

const:常量连接;

eq_ref:主键索引(primary key)或者非空唯一索引(unique not null)等值扫描;

ref:非主键非唯一索引等值扫描;

range:范围扫描;

index:索引树扫描;

ALL:全表扫描(full table scan)

上面各类扫描方式由快到慢: system > const > eq_ref > ref > range > index > ALL

避免在 where 子句中对字段进行 null 值判断,对于null的判断会导致引擎放弃使用索引而进行全表扫描

当只需要一条数据的时候,使用limit 1,这是为了使EXPLAIN中type列达到const类型

2.SQL语句中IN包含的值不应太多

MySQL对于IN做了相应的优化,即将IN中的常量全部存储在一个数组里面,而且这个数组是排好序的。但是如果数值较多,产生的消耗也是比较大的。
再例如:

select id from table_name where num in(1,2,3)

对于连续的数值,能用 between 就不要用 in 了;再或者使用连接来替换。

3.SELECT语句务必指明字段名称

SELECT *增加很多不必要的消耗(cpu、io、内存、网络带宽)增加了使用覆盖索引的可能性;当表结构发生改变时,前断也需要更新。所以要求直接在select后面接上字段名。

4.如果排序字段没有用到索引,就尽量少排序

5.如果限制条件中其他字段没有索引,尽量少用or

or两边的字段中,如果有一个不是索引字段,而其他条件也不是索引字段,会造成该查询不走索引的情况。很多时候使用 union all 或者是union(必要的时候)的方式来代替“or”会得到更好的效果

6.尽量用union all代替union

union和union all的差异主要是前者需要将结果集合并后再进行唯一性过滤操作,这就会涉及到排序,增加大量的CPU运算,加大资源消耗及延迟。当然,union all的前提条件是两个结果集没有重复数据

7.不使用ORDER BY RAND()

select id from `table_name` order by rand() limit 1000;

上面的sql语句,可优化为

select id from `table_name` t1 join 
(select rand() * (select max(id) from `table_name`) as nid) t2 
on t1.id > t2.nid limit 1000;

8.区分in和exists, not in和not exists

select * from 表A where id in (select id from 表B)

上面sql语句相当于

select * from 表A where exists
(select * from 表B where 表B.id=表A.id)

区分in和exists主要是造成了驱动顺序的改变(这是性能变化的关键),如果是exists,那么以外层表为驱动表,先被访问,如果是IN,那么先执行子查询。所以IN适合于外表大而内表小的情况;EXISTS适合于外表小而内表大的情况

关于not in和not exists,推荐使用not exists,不仅仅是效率问题,not in可能存在逻辑问题。如何高效的写出一个替代not exists的sql语句? 原sql语句

select colname … from A表 where a.id not in (select b.id from B表)

高效的sql语句

select colname … from A表 Left join B表 on 
where a.id = b.id where b.id is null

取出的结果集如下图表示,A表不在B表中的数据
在这里插入图片描述

9.使用合理的分页方式以提高分页的效率

select id,name from table_name limit 866613, 20

使用上述sql语句做分页的时候,可能有人会发现,随着表数据量的增加,直接使用limit分页查询会越来越慢。
优化的方法如下:可以取前一页的最大行数的id,然后根据这个最大的id来限制下一页的起点。比如此列中,上一页最大的id是866612。sql可以采用如下的写法:

select id,name from table_name where id> 866612 limit 20

10.分段查询

在一些用户选择页面中,可能一些用户选择的时间范围过大,造成查询缓慢。主要的原因是扫描行数过多。这个时候可以通过程序,分段进行查询,循环遍历,将结果合并处理进行展示。
如下图这个sql语句,扫描的行数成百万级以上的时候就可以使用分段查询
在这里插入图片描述

11.不建议使用%前缀模糊查询

例如LIKE “%name”或者LIKE “%name%”,这种查询会导致索引失效而进行全表扫描。但是可以使用LIKE “name%”
那如何查询%name%?
如下图所示,虽然给secret字段添加了索引,但在explain结果果并没有使用
在这里插入图片描述

那么如何解决这个问题呢,答案:使用全文索引
在我们查询中经常会用到

select id,fnum,fdst from table_name where user_name like '%zhangsan%'

这样的语句,普通索引是无法满足查询需求的。庆幸的是在MySQL中,有全文索引来帮助我们。
创建全文索引的sql语法是:

ALTER TABLE `table_name` ADD FULLTEXT INDEX `idx_user_name` (`user_name`);

使用全文索引的sql语句是:

select id,fnum,fdst from table_name 
where match(user_name) against('zhangsan' in boolean mode);

12.避免在where子句中对字段进行表达式操作

比如

select user_id,user_project from table_name where age * 2 = 18;

中对字段就行了算术运算,这会造成引擎放弃使用索引,建议改成

select user_id,user_project from table_name where age = 18 / 2;

13.避免隐式类型转换

where 子句中出现 column 字段的类型和传入的参数类型不一致的时候发生的类型转换,建议先确定where中的参数类型
在这里插入图片描述

14.对于联合索引来说,要遵守最左前缀法则

举列来说索引含有字段id,name,school,可以直接用id字段,也可以id,name这样的顺序,但是name,school都无法使用这个索引。所以在创建联合索引的时候一定要注意索引字段顺序,常用的查询字段放在最前面

15.必要时可以使用force index来强制查询走某个索引

有的时候MySQL优化器采取它认为合适的索引来检索sql语句,但是可能它所采用的索引并不是我们想要的。这时就可以采用force index来强制优化器使用我们制定的索引。

16.注意范围查询语句

对于联合索引来说,如果存在范围查询,比如between,>,<等条件时,会造成后面的索引字段失效。

17.关于JOIN优化

在这里插入图片描述

LEFT JOIN A表为驱动表
INNER JOIN MySQL会自动找出那个数据少的表作用驱动表
RIGHT JOIN B表为驱动表
注意:MySQL中没有full join,可以用以下方式来解决

select * from A left join B on B.name = A.name 
where B.name is null
union all
select * from B;

尽量使用inner join,避免left join

参与联合查询的表至少为2张表,一般都存在大小之分。如果连接方式是inner join,在没有其他过滤条件的情况下MySQL会自动选择小表作为驱动表,但是left join在驱动表的选择上遵循的是左边驱动右边的原则,即left join左边的表名为驱动表。
合理利用索引

被驱动表的索引字段作为on的限制字段。

利用小表去驱动大表

在这里插入图片描述

从原理图能够直观的看出如果能够减少驱动表的话,减少嵌套循环中的循环次数,以减少 IO总量及CPU运算的次数。
巧用STRAIGHT_JOIN

inner join是由mysql选择驱动表,但是有些特殊情况需要选择另个表作为驱动表,比如有group by、order by等「Using filesort」、「Using temporary」时。
STRAIGHT_JOIN来强制连接顺序,在STRAIGHT_JOIN左边的表名就是驱动表,右边则是被驱动表。在使用STRAIGHT_JOIN有个前提条件是该查询是内连接,也就是inner join。
其他链接不推荐使用STRAIGHT_JOIN,否则可能造成查询结果不准确。
在这里插入图片描述

这个方式有时可能减少3倍的时间。

总结

以上就是今天要讲的内容,本文介绍了mysql优化的一些方法。


http://chatgpt.dhexx.cn/article/1oP0ZbuW.shtml

相关文章

一文带你你搞懂索引如何优化!!!

前言 索引的相信大家都听说过&#xff0c;但是真正会用的又有几人&#xff1f;平时工作中写SQL真的会考虑到这条SQL如何能够用上索引&#xff0c;如何能够提升执行效率&#xff1f;此篇文章详细的讲述了索引优化的几个原则&#xff0c;只要在工作中能够随时应用到&#xff0c;相…

使用AJAX实现数据的增删改查

主页&#xff1a;index.html <!DOCTYPE html><html> <head> <meta charset"UTF-8"> <title></title> <script src"http://libs.baidu.com/jquery/2.1.4/jquery.min.js"></script> </head> <body…

合肥工业大学数据库上机实验3(第3次实验)

大三上学期的实验了&#xff0c;一直没来得及放到博客上面&#xff0c;博主所在学校的数据库实验都很简单。&#xff08;不明白为什么截图上传之后为什么那么糊&#xff09; 文章目录 实验9&#xff1a;触发器的创建与使用1. 实验目的2. 实验要求3. 实验内容4. 实验步骤5. 实验…

第三章课后题

3.有两个关系S(A,B,C,D)和T(C,D,E,F)&#xff0c;写出与下列等价的SQL表达式。 &#xff08;1&#xff09; σ A 10 ( S ) \sigma_{A10}(S) σA10​(S) 对行的选择&#xff0c;列全部显示。 SELECT * FROM S WHERE A10;&#xff08;2&#xff09; Π A , B ( S ) \Pi_{A,B}(…

SQL 数据库上机实验(查询操作)

大二数据库上机实验 实验一实验二 实验一 实验步骤&#xff1a; 1&#xff1a;创建数据库“shiyan2”&#xff1b; 2&#xff1a;创建数据表’s’,’p’,’j’&#xff1b; 3&#xff1a;创建数据表’spj’并设定’sno’,’pno’,’jno’三列为外键&#xff0c;分别关联于s表的…

实验3 SQL的复杂多表查询以及视图

第1关 查询所有“红色”的15公斤及以上的零件名 任务描述 查询所有“红色”的15公斤及以上的零件名 相关知识 零件表P由零件代码&#xff08;PNO&#xff09;、零件名(PNAME)、颜色(COLOR)、重量(WEIGHT)组成&#xff1b; P表如下图&#xff1a; 现已构建P表&#xff0c;结构信…

【系统分析师之路】第十五章 复盘数据库系统(关系数据库应用)

【系统分析师之路】第十五章 复盘数据库系统&#xff08;关系数据库应用&#xff09; 复盘数据库系统—关系数据库应用 【系统分析师之路】第十五章 复盘数据库系统&#xff08;关系数据库应用&#xff09;前言部分 历年真题考点分析1&#xff09;考点分析2&#xff09;重要知识…

数据库系统概论练习3

一、填空题 能够唯一标识实体的属性或属性组称为____实体的码______。如果两个关系没有公共属性&#xff0c;则其自然联接操作与____笛卡尔积_____操作等价。SQL中聚合函数“COUNT&#xff08;*&#xff09;”的功能是___统计元组个数________。关系模式如果为1NF&#xff0c;则…

数据库第七周作业——第三章课后习题

3.有两个关系S&#xff08;A,B,C,D&#xff09;和T&#xff08;C,D,E,F&#xff09;,写出与下列查询等价的SQL表达式&#xff1a; (1&#xff09;σ A10(S&#xff09; SELECT * FROM S WHERE A10;(2&#xff09;π A , B ( S ) SELECT A,B FROM S;(3&#xff09;S ⋈ T SEL…

第三章作业【数据库原理】

第二章作业【数据库原理】 前言推荐第三章作业第3章第1题简答题第3章第2题&#xff08;关系代数->SQL代码&#xff09;第3章第3题&#xff08;创建SPJ数据库中的四张表&#xff09;模拟数据第3章第4题&#xff08;SPJ数据库上完成查询&#xff09;第3章第5题&#xff08;SPJ…

设有一个工程供应数据库系统,包括如下四个关系模式:S(Sno,Sname, Status,City) ;P(Pno,Pname,Color ,Weight);J(Jno,Jname, Ci

设有一个工程供应数据库系统&#xff0c;包括如下四个关系模式&#xff1a; S(Sno&#xff0c;Sname&#xff0c; Status&#xff0c;City) &#xff1b; P(Pno&#xff0c;Pname&#xff0c;Color &#xff0c;Weight)&#xff1b; J(Jno&#xff0c;Jname&#xff0c; City) …

高通WLAN框架学习(17)-- NIO和PNO

本章详细介绍了preferred network offload (PNO)扫描概述、流、模式和配置文件。 18.1 PNO扫描概述 WLAN STA在通过AP模组连接AP之前,需要偶尔对环境进行扫描。 在WLAN请求程序中对扫描结果进行解析和处理,以确定是否至少有一个目标(附近)AP在附近。 为了偶尔发出扫描,应用…

Wi-Fi PNO扫描流程(Android P)

简介&#xff1a;当手机灭屏情况下&#xff0c;有保存网络时&#xff0c;若已连接&#xff0c;不扫描&#xff0c;否则&#xff0c;PNO扫描&#xff0c;即只扫描已保存的网络。最小间隔min20s&#xff0c;最大间隔max20s*360s PNO 即Preferred Network Offload&#xff0c;用于…

[RK3288][Android6.0] WiFi之PNO功能了解

Platform: Rockchip OS: Android 6.0 Kernel: 3.10.92 概念: PNO 即Preferred Network Offload,用于系统在休眠的时候连接WiFi 此功能是在Android3.1加入的 缺陷: 在使用PNO时,有潜在泄露个人隐私的风险。这里没明白,意思是说PNO会发送之前的连接过的网络给AP,然…

二值化的方法

1.二值化 图像二值化的目的是最大限度的将图像中感兴趣部分保留下来&#xff0c;在很多情况下&#xff0c;也是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。在这些庞大的图像二值化分类方法中&#xff0c;基于直方图的全局二值算法占有了绝对的市场份额&…

OpenCV-Python学习(10)—— OpenCV 图像二值化处理(cv.threshold)

1. 学习目标 理解图像的分类&#xff0c;不同类型的图像的区别&#xff1b;对图像进行二值化处理&#xff0c;对【 cv.threshold 】函数的理解。 2. 图像分类 2.1 不同类型图像说明 按照颜色对图像进行分类&#xff0c;可以分为二值图像、灰度图像和彩色图像。 二值图像&…

python 图像二值化处理

python 图像二值化处理 import os from PIL import Image import shutilfile_path ./5-crack919/mask/ save_path ./5-crack919/mask01/ if not os.path.exists(save_path):os.makedirs(save_path) ###二值化 for filename in os.listdir(file_path):print(filename)img …

图像处理之二值化图像

图像二值化就是将图像上的像素点的灰度值设置为0或255&#xff0c;也就是将整个图像呈现出明显的黑白效果。将所有灰度大于或等于阈值的像素被判定为属于特定物体&#xff0c;其灰度值为255表示&#xff0c;否则这些像素点被排除在物体区域以外&#xff0c;灰度值为0&#xff0…

二值化之阈值处理

写于开头的废话&#xff1a;哒哒哒.......这应该是马蹄的声音&#xff01;我在告诉你&#xff0c;我又来了&#xff01;不得不说的还是自己的悲伤&#xff0c;经营了那么久的CSDN居然说关就给我关了&#xff0c;过去的还是没法过去&#xff0c;我始终不能从失去的痛苦之中走出来…

图像处理之二值化

图像处理之二值化 二值化方式 二值化算法 二值化方式 二值化方式分为五种&#xff1a; THRESH_BINARY&#xff1a;将大于某一个阈值的变成最大值&#xff0c;其他为0 THRESH_BINARY_INV&#xff1a;和THRESH_BINARY恰好相反 THRESH_TRUNC&#xff1a; trunc就是截断的意思&…