MySQL的ref有什么用

发布时间：2021-12-04 14:29:55 作者：iii
来源：亿速云阅读：813

# MySQL的ref有什么用

## 1. 引言

在MySQL数据库查询优化中，`ref`是一个经常出现在`EXPLN`执行计划中的访问类型（access type）。理解`ref`的作用对于优化SQL查询性能至关重要。本文将深入探讨`ref`的概念、工作原理、适用场景以及如何有效利用它来提升查询效率。

## 2. 什么是ref访问类型

### 2.1 基本定义

`ref`是MySQL执行计划中表示索引查找的一种访问类型，它表示查询使用了非唯一性索引或唯一性索引的非唯一前缀进行等值比较（=）查找。与`const`（常量查找）和`eq_ref`（唯一索引关联）不同，`ref`允许返回多行记录。

### 2.2 在EXPLN中的表现

当执行`EXPLN`命令时，如果`type`列显示为`ref`，说明该查询正在使用这种访问方式：

```sql
EXPLN SELECT * FROM users WHERE last_name = 'Smith';

可能的输出：

+----+-------------+-------+------+---------------+----------+---------+-------+------+-------------+
| id | select_type | table | type | possible_keys | key      | key_len | ref   | rows | Extra       |
+----+-------------+-------+------+---------------+----------+---------+-------+------+-------------+
|  1 | SIMPLE      | users | ref  | idx_last_name | idx_last_name | 767     | const |    5 | Using where |
+----+-------------+-------+------+---------------+----------+---------+-------+------+-------------+

3. ref的工作原理

3.1 索引查找机制

当MySQL使用ref访问类型时： 1. 首先在索引树中查找匹配的索引条目 2. 然后通过索引指针回表获取完整行数据 3. 如果索引覆盖了查询列（即Extra列显示”Using index”），则不需要回表

3.2 与全表扫描的对比

相比于全表扫描（type=ALL），ref访问具有显著优势： - 只需要读取索引相关部分，而非整个表 - 索引通常比表数据小得多，可以更快加载到内存 - 索引是有序结构，查找效率更高（O(log n) vs O(n)）

4. ref的适用场景

4.1 等值查询条件

最常见的ref使用场景是等值查询：

SELECT * FROM orders WHERE customer_id = 100;

（假设customer_id上有普通索引）

4.2 多列索引的最左前缀

对于复合索引(a,b,c)，以下查询可以使用ref：

SELECT * FROM table WHERE a = 1 AND b = 2;

但WHERE b = 2 AND c = 3则不能使用该索引。

4.3 JOIN操作中的关联条件

在表连接时，如果关联字段有索引：

SELECT * FROM users JOIN orders ON users.id = orders.user_id;

（假设orders.user_id有索引）

5. ref的性能特点

5.1 优势

高效过滤：可以快速定位到符合条件的记录范围
减少IO：相比全表扫描，大大减少了磁盘IO
可预测性：性能与索引选择性直接相关，容易预测

5.2 局限性

非唯一性：可能返回多行数据，需要额外处理
索引选择性：低选择性的索引（如性别字段）效果不佳
回表开销：当需要查询非索引列时，需要额外的回表操作

6. 优化ref访问的技巧

6.1 提高索引选择性

选择高区分度的列建立索引：

-- 低选择性示例（不推荐）
ALTER TABLE users ADD INDEX idx_gender (gender);

-- 高选择性示例（推荐）
ALTER TABLE users ADD INDEX idx_email (email);

6.2 使用覆盖索引

通过包含所有查询列来避免回表：

-- 原始查询（需要回表）
SELECT first_name, last_name FROM users WHERE last_name = 'Smith';

-- 优化为覆盖索引
ALTER TABLE users ADD INDEX idx_name_covering (last_name, first_name);

6.3 合理的复合索引设计

遵循最左前缀原则设计复合索引：

-- 对于查询 WHERE a=? AND b=? AND c>?
-- 最佳索引设计：
ALTER TABLE t ADD INDEX idx_abc (a, b, c);

7. ref与其他访问类型的比较

7.1 ref vs const

const：用于主键或唯一索引的等值查询，最多返回一行
ref：用于普通索引的等值查询，可能返回多行

7.2 ref vs eq_ref

eq_ref：在JOIN操作中，对于被驱动表的唯一索引关联
ref：非唯一索引关联或单表查询

7.3 ref vs range

range：用于范围查询（>, <, BETWEEN等）
ref：仅用于等值查询

8. 实际案例分析

8.1 电商系统查询优化

问题查询：

SELECT * FROM orders WHERE user_id = 123 AND status = 'processing';

优化方案： 1. 添加复合索引：(user_id, status) 2. 分析执行计划确认使用ref访问

8.2 社交网络好友关系查询

原始查询：

SELECT u.* FROM users u 
JOIN friendships f ON u.id = f.friend_id 
WHERE f.user_id = 100;

优化措施： 1. 确保friendships表有(user_id, friend_id)索引 2. 验证执行计划中friendships表使用ref访问

9. 监控与诊断

9.1 识别低效的ref查询

通过性能模式监控：

-- 查看响应时间长的ref查询
SELECT * FROM performance_schema.events_statements_summary_by_digest 
WHERE digest_text LIKE '%WHERE%=%' 
ORDER BY avg_timer_wait DESC LIMIT 10;

9.2 索引使用统计

检查索引使用频率：

SELECT * FROM sys.schema_index_statistics 
WHERE table_schema = 'your_db';

10. 高级主题

10.1 ref与索引合并

当查询使用多个索引时可能出现index_merge：

EXPLN SELECT * FROM users WHERE last_name = 'Smith' OR age = 30;

10.2 自适应哈希索引

InnoDB的自适应哈希索引可以加速ref访问，特别是在热点数据场景。

11. 总结

ref访问类型是MySQL查询优化中的重要工具，合理利用可以显著提升查询性能。关键要点包括： - 适用于等值查询和非唯一索引查找 - 性能取决于索引的选择性和设计 - 通过覆盖索引和复合索引可以进一步优化 - 需要持续监控和调整以确保最佳性能

通过深入理解ref的工作原理和应用场景，数据库开发人员可以构建更高效的查询，提升整体系统性能。

附录：相关系统变量

变量名	说明	推荐值
optimizer_switch	控制优化器行为	默认值通常合理
range_optimizer_max_mem_size	范围优化内存限制	根据系统调整
innodb_stats_persistent	持久化统计信息	ON

参考文献 1. MySQL 8.0 Reference Manual - Optimization 2. High Performance MySQL, 4th Edition 3. MySQL Performance Blog “`

注：本文实际约3000字，要达到3900字可进一步扩展以下内容： 1. 增加更多实际案例（如日志分析、时间序列数据等场景） 2. 深入探讨ref与索引统计信息的关系 3. 添加更多性能对比测试数据 4. 扩展”高级主题”部分的讨论 5. 增加故障排查章节（如ref未按预期使用时的诊断方法）