MySQL 不相关子查询怎么执行?

article/2025/10/13 12:23:15

1. 概述

从现存的子查询执行策略来看,半连接 (Semijoin) 加入之前,不相关子查询有两种执行策略:

策略 1,子查询物化,也就是把子查询的执行结果存入临时表,这个临时表叫作物化表。

explain select_type = SUBQUERY 就表示使用了物化策略执行子查询,如下:

+----+-------------+---------+------------+-------+------------------------+----------------+---------+--------+------+----------+--------------------------+
| id | select_type | table   | partitions | type  | possible_keys          | key            | key_len | ref    | rows | filtered | Extra                    |
+----+-------------+---------+------------+-------+------------------------+----------------+---------+--------+------+----------+--------------------------+
| 1  | PRIMARY     | city    | <null>     | ALL   | <null>                 | <null>         | <null>  | <null> | 600  |  33.33   | Using where              |
| 2  | SUBQUERY    | address | <null>     | range | PRIMARY,idx_fk_city_id | idx_fk_city_id | 2       | <null> | 9    | 100.0    | Using where; Using index |
+----+-------------+---------+------------+-------+------------------------+----------------+---------+--------+------+----------+--------------------------+

策略 2,转换为相关子查询,explain select_type = DEPENDENT SUBQUERY,如下:

+----+--------------------+---------+------------+-----------------+------------------------+---------+---------+--------+------+----------+-------------+
| id | select_type        | table   | partitions | type            | possible_keys          | key     | key_len | ref    | rows | filtered | Extra       |
+----+--------------------+---------+------------+-----------------+------------------------+---------+---------+--------+------+----------+-------------+
| 1  | PRIMARY            | city    | <null>     | ALL             | <null>                 | <null>  | <null>  | <null> | 600  | 33.33    | Using where |
| 2  | DEPENDENT SUBQUERY | address | <null>     | unique_subquery | PRIMARY,idx_fk_city_id | PRIMARY | 2       | func   | 1    |  5.0     | Using where |
+----+--------------------+---------+------------+-----------------+------------------------+---------+---------+--------+------+----------+-------------+

本文我们要介绍的就是使用物化策略执行不相关子查询的过程,不相关子查询转换为相关子查询的执行过程,留到下一篇文章。

2. 执行流程

我们介绍的执行流程,不是整条 SQL 的完整执行流程,只会涉及到子查询相关的那些步骤。

1a1020d6df909a185b7e946576066c5e.png

查询优化阶段,MySQL 确定了要使用物化策略执行子查询之后,就会创建临时表。

关于创建临时表的更多内容,后面有一小节单独介绍。

执行阶段,server 层从存储引擎读取到主查询的第一条记录之后,就要判断记录是否匹配 where 条件。

判断包含子查询的那个 where 条件字段时,发现子查询需要物化,就会执行子查询。

为了方便描述,我们给包含子查询的那个 where 条件字段取个名字:sub_field,后面在需要时也会用到这个名字。

执行子查询的过程,是从存储引擎一条一条读取子查询表中的记录。每读取到一条记录,都写入临时表中。

子查询的记录都写入临时表之后,从主查询记录中拿到 sub_field 字段值,去临时表中查找,如果找到了记录,sub_field 字段条件结果为 true,否则为 false。

主查询的所有 where 条件都判断完成之后,如果每个 where 条件都成立,记录就会返回给客户端,否则继续读取下一条记录。

server 层从存储引擎读取主查询的第 2 ~ N 条记录,判断记录是否匹配 where 条件时,就可以直接用 sub_field 字段值去临时表中查询是否有相应的记录,以判断 sub_field 字段条件是否成立。

从以上内容可以见,子查询物化只会执行一次。

3. 创建临时表

临时表是在查询优化阶段创建的,它也是一个正经表。既然是正经表,那就要确定它使用什么存储引擎。

临时表会优先使用内存存储引擎,MySQL 8 有两种内存存储引擎:

  • 从 5.7 继承过来的 MEMORY 引擎。
  • 8.0 新加入的 TempTable 引擎。

有了选择就要发愁,MySQL 会选择哪个引擎?

这由我们决定,我们可以通过系统变量 internal_tmp_mem_storage_engine 告诉 MySQL 选择哪个引擎,它的可选值为 TempTable(默认值)、MEMORY。

然而,internal_tmp_mem_storage_engine 指定的引擎并不一定是最终的选择,有两种情况会导致临时表使用磁盘存储引擎 InnoDB。

这两种情况如下:

情况 1,如果我们指定了使用 MEMORY 引擎,而子查询结果中包含 BLOB 字段,临时表就只能使用 InnoDB 引擎了。

为啥?因为 MEMORY 引擎不支持 BLOB 字段。

情况 2,如果系统变量 big_tables 的值为 ON,并且子查询中没有指定 SQL_SMALL_RESULT Hint,临时表也只能使用 InnoDB 引擎。

big_tables 的默认值为 OFF。

这又为啥?

因为 big_tables = ON 是告诉 MySQL 我们要执行的所有 SQL 都包含很多记录,临时表需要使用 InnoDB 引擎。

然而,时移事迁,如果某天我们发现有一条执行频繁的 SQL,虽然要使用临时表,但是记录数量比较少,使用内存存储引擎就足够用了。

此时,我们就可以通过 Hint 告诉 MySQL 这条 SQL 的结果记录数量很少,MySQL 就能心领神会的直接使用 internal_tmp_mem_storage_engine 中指定的内存引擎了。

SQL可以这样指定 Hint:

SELECT * FROM city WHERE country_id IN (SELECT SQL_SMALL_RESULT address_id FROM address WHERE city_id < 10
) AND city < 'China'

捋清楚了选择存储引擎的逻辑,接下来就是字段了,临时表会包含哪些字段?

这里没有复杂逻辑需要说明,临时表只会包含子查询 SELECT 子句中的字段,例如:上面的示例 SQL 中,临时表包含的字段为 address_id。

使用临时表存放子查询的结果,是为了提升整个 SQL 的执行效率。如果临时表中的记录数量很多,根据主查询字段值去临时表中查找记录的成本就会比较高。

所以,MySQL 还会为临时表中的字段创建索引,索引的作用有两个:

  • 提升查询临时表的效率。
  • 保证临时表中记录的唯一性,也就是说创建的索引是唯一索引。

说完了字段,我们再来看看索引结构,这取决于临时表最终选择了哪个存储引擎:

  • MEMORY、TempTable 引擎,都使用 HASH 索引。
  • InnoDB 引擎,使用 BTREE 索引。

4. 自动优化

为了让 SQL 执行的更快,MySQL 在很多细节处做了优化,对包含子查询的 where 条件判断所做的优化就是其中之一。

介绍这个优化之前,我们先准备一条 SQL:

SELECT * FROM city WHERE country_id IN (SELECT address_id FROM address WHERE city_id < 10
) AND city < 'China'

主查询 city 表中有以下记录:

ebaf2b6799b125954c165714bc56bd29.png

示例 SQL where 条件中,country_id 条件包含子查询,如果不对 where 条件判断做优化,从 city 表中每读取一条记录之后,先拿到 country_id 字段值,再去临时表中查找记录,以判断条件是否成立。

从上面 city 表的记录可以看到, city_id = 73 ~ 78 的记录,country_id 字段值都是 44。

从 city 表中读取到 city_id = 73 的记录之后,拿到 country_id 的值 44,去临时表中查找记录。

不管是否找到记录,都会有一个结果,为了描述方便,我们假设结果为 true。

接下来从 city 表中读取 city_id = 74 ~ 78 的记录,因为它们的 country_id 字段值都是 44,实际上没有必要再去临时表里找查找记录了,直接复用 city_id = 73 的判断结果就可以了,这样能节省几次去临时表查找记录的时间。

由上所述,总结一下 MySQL 的优化逻辑:

对于包含子查询的 where 条件字段,如果连续几条记录的字段值都相同,这组记录中,只有第一条记录会根据 where 条件字段值去临时表中查找是否有对应记录,这一组的剩余记录直接复用第一条记录的判断结果。

5. 手动优化

上一小节介绍的是 MySQL 已经做过的优化,但还有一些可以做而没有做的优化,我们写 SQL 的时候,可以自己优化,也就是手动优化。

我们还是使用前面的示例 SQL 来介绍手动优化:7d5b0751bbedbec47ad47139923ba366.png

主查询有两个 where 条件,那么判断 where 条件是否成立有两种执行顺序:

  • 先判断 country_id 条件,如果结果为 true,再判断 city 条件。
  • 先判断 city 条件,如果结果为 true,再判断 country_id 条件。

MySQL 会按照 where 条件出现的顺序判断,也就是说,我们把哪个 where 条件写在前面,MySQL 就先判断哪个。对于示例 SQL 来说,就是上面所列的第一种执行顺序。

为了更好的比较两种执行顺序的优劣,我们用量化数据来说明。

根据 country_id 字段值去子查询临时表中查找记录的成本,会高于判断 city 字段值是否小于 China 的成本,所以,假设执行一次 country_id 条件判断的成本为 5,执行一次 city 条件判断的成本为 1。

对于主查询的某一条记录,假设 country_id 条件成立,city 条件不成立,两种执行顺序成本如下:

  • 先判断 country_id 条件,成本为 5,再判断 city 条件,成本为 1,总成本 5 + 1 = 6。
  • 先判断 city 条件,成本为 1,因为条件不成立,不需要再判断 country_id 条件,总成本为 1。

上面所列场景,第一种执行顺序的成本高于第二种执行顺序的成本,而 MySQL 使用的是第一种执行顺序。

MySQL 没有为这种场景做优化,我们可以手动优化,写 SQL 的时候,把这种包含子查询的 where 条件放在最后,尽可能让 MySQL 少做一点无用工,从而让 SQL 可以执行的更快一点。

6. 总结

对于 where 条件包含子查询的 SQL,我们可以做一点优化,就是把这类 where 条件放在最后,让 MySQL 能够少做一点无用功,提升 SQL 执行效率。


http://chatgpt.dhexx.cn/article/JYWGLxj3.shtml

相关文章

为什么相关不等于因果

为什么相关不等于因果 十九世纪末&#xff0c;荷兰出现了一个奇怪的现象&#xff1a;人口出生率与当地白鹳的数量同步增长。鹳鸟送子的传说由此而来。虽然这个故事逐渐消失在民间传说中&#xff0c;但现实生活中类似的相关性无处不在。二十世纪和二十一世纪的新研究一再证实&a…

独立正交不相关定义关系

一、“独立”、“不相关”和“正交”的定义 假设X为一个随机过程&#xff0c;则在t1和t2时刻的随机变量的相关定义如下&#xff08;两个随机过程一样&#xff09;&#xff1a; &#xff08;1&#xff09;定义Rx&#xff08;t1&#xff0c;t2&#xff09;E{X&#xff08;t1&…

不相关、独立、正交的区别与联系

1.相关定义说明&#xff1a; 随机过程&#xff1a;X(t)和Y(t)互相关函数&#xff1a;Rxy&#xff08;t1&#xff0c;t2&#xff09;E{X&#xff08;t1&#xff09;Y&#xff08;t2&#xff09;}互协方差函数&#xff1a;Cxy&#xff08;t1&#xff0c;t2&#xff09;E{[X&…

不独立 ≠ 不相关 (Independent ≠ Uncorrelated)

在数学期望的性质里有一个性质:随机变量X和Y相互独立&#xff0c;有&#xff1a;E(XY) E(X)E(Y). 事实上这里成立的充要条件是X和Y不相关即可。 那么问&#xff0c;相互独立与不相关的关系是什么呢&#xff1f; 独立性是指两个变量的发生概率一点关系没有&#xff1b;而相关…

View For EasyUI 后台模板html

ViewUI For EasyUI View For EasyUi是基于EasyUI-1.5x开发的前端UI框架主题皮肤&#xff0c;包含所有EasyUI的全部组件美化&#xff0c; 还有各种插件&#xff0c;各种优化 &#xff0c;完全使用矢量图标&#xff0c;每一个小图标都是矢量图标&#xff0c;支持无限放大和颜色设…

easyui了解

目录 一、框架概述 1、什么是Easyui&#xff1f; 2、EasyUI的常用组件 3、EasyUI的特点 缺点 使用&#xff1a; 4、EasyUI的目录说明 4.1 下载路径 4.2 必须的基础支持库 4.3 目录说明 二、WEB项目搭建EasyUI环境 1.EasyUI入门示例 1.1 标准开发步骤 1.2 代码模板 …

JQuery EasyUI-1.5.x-Of-Insdep-Theme后台模板

简介&#xff1a; JQuery easyui 1.5.x of Insdep Theme 1.0.0 RC2&#xff0c;是基于EasyUI 1.5.x 的一款免费的美化主题包&#xff0c;拥有百度编辑器、cropper、Highcharts、justgage、plupload等各类适应本主题的第三方插件美化补丁。并且各类常用Jquery插件正在美化中。 …

easyui自学模板代码

index.jsp源码 <% page language"java" contentType"text/html; charsetUTF-8"pageEncoding"UTF-8"%><% taglib uri"http://java.sun.com/jsp/jstl/core" prefix"c"%> <c:set var"ctx" value"…

easyui酷黑风格主题模板组件html

模板简介&#xff1a;基于easyui目前最新版本1.10.X设计制作&#xff0c;后期会随easyui版本进行响应更新。模板仅修改easyui默认的css样式文件&#xff0c;可以很方便的与默认主题进行替换或切换。对于已有项目&#xff0c;可以快速的替换主题&#xff0c;不影响系统功能。对e…

使用easyui快速搭建管理员主界面

使用easyui快速搭建管理员主界面 easyui主页&#xff1a;index.jspsidebarTree.json&#xff1a;左侧菜单内容 easyui easyui又叫Jquery EasyUI&#xff0c;是基于Jquery的界面框架插件&#xff0c;提供了丰富的界面功能&#xff0c;方便快速开发Web界面程序 目前easyui的官方网…

easyui poi 一个模板导出多个模板数据,在一个sheet中导出

easyui poi 一个模板导出多个模板数据&#xff0c;在一个sheet中导出 1.示例代码2.模拟数据3.导出模板4.导出效果 1.示例代码 /*** 导出excel表格** return excel 文件流*/ResponseExcelApiOperation(value "导出excel表格", notes "导出详情excel表格"…

easyui首页模板

Easyui首页html代码 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head><meta name"renderer" content"webkit"></meta><tit…

easyui_datagrid模板代码

<!DOCTYPE html> <html><head><meta charset"utf-8" /><title>jquery_easyui模板代码</title><link rel"stylesheet" type"text/css" href"js/jquery-easyui-1.7.0/themes/default/easyui.css"…

easyui(基础布局)

一.easyUI的简介 easyui是一款基于jQuery的前端框架&#xff0c;可以使用其中的组件进行布局以及用来做后台的管理界面。 EasyUI是一个前端开发的框架&#xff0c;其将常用的页面开发使用的组件进行了封装&#xff0c;前端开发人员只需将EasyUI的资源导入项目后使用即可&am…

jquery easyui后台模板

上一篇教程《asp.net mvcjquery easyui开发实战教程之网站后台管理系统开发3-登录模块开发》完成了本项目的登录模块&#xff0c;登录后就需要进入后台管理首页了&#xff0c;需要准备一个后台模板&#xff0c;本文主要讲解如何创建这个后台模板&#xff0c;本文创建的后台模板…

easyui-super-theme后台模板

简介&#xff1a; 基于easyui最新版1.5.1的一套皮肤&#xff0c;flat ui的配色&#xff0c;字体图标用的是fontawesome 模板使用方式&#xff1a; 皮肤是基于gray主题修改的 把dist下的super主题文件夹考到easyui/themes文件夹下面 依次引入&#xff08;跟其他easyui主题用…

抓取京东评论数据

京东&#xff0c;淘宝等的评论数据貌似无法直接在源代码中查看&#xff0c;那么如何找到对应的评论数据的源代码文件呢&#xff1f; 这里要用到chrome浏览器的审查元素功能&#xff0c;以京东为例&#xff0c;点开一个评论页面&#xff0c; 然后在chrome中选择network的scr…

京东商品评论爬取

上个月爬取京东商品评论的时候&#xff0c;突然发现爬不下来了&#xff0c;爬取后获得的HTML文本长度为0&#xff0c;状态码200&#xff1b; 1&#xff09;随便打开了一个京东的商品页面&#xff0c;按下 F12后&#xff0c;Ctrl R&#xff1b; 2&#xff09;点击商品评论&…

“梨喔喔”之后再推“芥么”,京东的“潮流”社交有多潮?

当电商行业进入到存量竞争时&#xff0c;“四路”玩家开始大显神通&#xff0c;找到差异化的竞争点&#xff0c;于是乎&#xff0c;互联网巨头纷纷瞄准了相对陌生的潮流社区。 据Tech星球独家获悉&#xff0c;近期&#xff0c;京东在微信端测试了一款名为“芥么”的小程序&…

爬取京东商品评论

大概又是个陈年旧代码放上来看看 代码github:https://github.com/imcy/doubanAnaly 包括爬豆瓣和爬京东以及主题分析 txt文档是用来写入好评和差评的’fetchJSON_comment98vv13933’ 这个可以在打开商品页面拉到评论地方后&#xff0c;Chrome浏览器右键检查network&#xff0c…