MYSQL数据库中Join的操作原理是什么

发布时间:2021-07-05 14:45:36 作者:Leah
来源:亿速云 阅读:149

今天就跟大家聊聊有关MYSQL数据库中Join的操作原理是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

Join使用的是Nested-Loop Join算法,Nested-Loop Join有三种

select * from t1 join t2 on t1.a = t2.a;
-- a 100条数据, b 1000条数据

Simple Nested-Loop Join

会遍历t1全表,t1作为驱动表,t1中的每一条数据都会到t2中做一次全表查询,该过程会比较100*1000次。

每次在t2中做全表查询时,全表扫描可就不保证在内存里了,Buffer Pool会淘汰,有可能在磁盘。

Block Nested-Loop Join(MYSQL驱动链接没有使用索引)

会遍历t1全表,将t1数据加载到join_buffer中,再遍历t2全表,让t2的每条数据去匹配join_buffer中t1缓存的数据。

t1全表扫描 = 100次

t2全表扫描 = 1000次

查询次数 = 1100次

join_buffer中比较 = 100 * 1000次

比较的次数和Simple Nested-Loop Join是一样的,但是比较的过程会比Simple Nested-Loop Join快很多,性能更好。

MYSQL数据库中Join的操作原理是什么

join_buffer是有大小的,如果t1查出来的数据是大于join_buffer大小的,则会先加载部分t1中的数据,比较完t2以后,清空join_buffer,再加载t1中剩余数据,加载不完全,再重复该操作。

t1全表扫描次数和join_buffer中比较1次数不变,但是t2的扫描次数会根据分段次数做一个乘法。

假设,驱动表的数据行数是 N,需要分 K 段才能完成算法流程,被驱动表的数据行数是 M。

K = λ * N

扫描被驱动表次数 = M * λ * N

MYSQL数据库中Join的操作原理是什么

λ是和join_buffer的大小有关的,join_buffer大小足够的情况下,大表驱动和小表驱动的时间是一样的。

需要分段的情况下,分段次数越少,被驱动表扫描的次数也会越少,所以应该采用小表驱动。

Index Nested-Loop Join(MYSQL驱动链接使用索引)

还是以上面的sql为例,如果a字段是有索引的。

t1表会扫描全表,t1表中每条数据会去t2表中做索引查询,查到id后再进行回表查询(如果连接字段是t2表的主键,回表操作将省略)。

t1扫描全表 = 100次

t2索引查询 = log1000次

t2回表查询 = log1000次

假设,驱动表的数据行数是 N,被驱动表的数据行数是 M。

总查询次数 = N + N * 2logM

由上可见,驱动表数据越大,查询的次数会越多,所以应该使用小表作为驱动表。

MYSQL数据库中Join的操作原理是什么

看完上述内容,你们对MYSQL数据库中Join的操作原理是什么有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注亿速云行业资讯频道,感谢大家的支持。

推荐阅读:
  1. MySQL中left join、right join和inner join的区别
  2. pt-online-schema-change的操作原理是什么

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

mysql join

上一篇:java中有哪些算数运算符的基础知识

下一篇:spring cloud zuul与nginx的域名转发问题如何解决

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》