MySQL中如何创建高效且合适的索引

发布时间：2021-09-24 13:54:31 作者：小新
来源：亿速云阅读：250

# MySQL中如何创建高效且合适的索引

## 目录
1. [索引基础概念](#1-索引基础概念)
   - 1.1 [什么是索引](#11-什么是索引)
   - 1.2 [索引的优缺点](#12-索引的优缺点)
2. [MySQL索引类型详解](#2-mysql索引类型详解)
   - 2.1 [B-Tree索引](#21-b-tree索引)
   - 2.2 [哈希索引](#22-哈希索引)
   - 2.3 [全文索引](#23-全文索引)
   - 2.4 [空间索引](#24-空间索引)
3. [创建高效索引的原则](#3-创建高效索引的原则)
   - 3.1 [选择合适的列](#31-选择合适的列)
   - 3.2 [索引列顺序策略](#32-索引列顺序策略)
   - 3.3 [避免索引失效](#33-避免索引失效)
4. [实战索引优化技巧](#4-实战索引优化技巧)
   - 4.1 [EXPLN命令详解](#41-explain命令详解)
   - 4.2 [覆盖索引优化](#42-覆盖索引优化)
   - 4.3 [索引合并策略](#43-索引合并策略)
5. [常见索引问题解决方案](#5-常见索引问题解决方案)
   - 5.1 [索引选择错误](#51-索引选择错误)
   - 5.2 [索引过多的问题](#52-索引过多的问题)
   - 5.3 [大数据量表索引优化](#53-大数据量表索引优化)
6. [高级索引策略](#6-高级索引策略)
   - 6.1 [前缀索引](#61-前缀索引)
   - 6.2 [函数索引](#62-函数索引)
   - 6.3 [自适应哈希索引](#63-自适应哈希索引)
7. [总结与最佳实践](#7-总结与最佳实践)

---

## 1. 索引基础概念

### 1.1 什么是索引

索引是数据库中用于加速数据检索的数据结构，类似于书籍的目录。MySQL中的索引是存储引擎级别的实现，不同存储引擎（如InnoDB、MyISAM）实现方式不同。

```sql
-- 创建基本索引示例
CREATE INDEX idx_name ON users(username);

1.2 索引的优缺点

优点： - 大幅提高查询速度（特别是WHERE、ORDER BY、GROUP BY操作） - 加速表连接操作 - 某些索引可以实现覆盖索引查询，避免回表

缺点： - 占用额外存储空间（索引文件可能比数据文件还大） - 降低写操作性能（INSERT/UPDATE/DELETE需要维护索引） - 不合理的索引会导致优化器选择困难

2. MySQL索引类型详解

2.1 B-Tree索引

最常见的索引类型，适用于全值匹配、范围查询和前缀匹配。

适用场景： - =, >, <, BETWEEN等操作 - LIKE ‘prefix%‘（前缀匹配） - 最左前缀原则

-- 复合索引示例
CREATE INDEX idx_name_age ON employees(last_name, first_name, age);

2.2 哈希索引

基于哈希表实现，仅支持精确匹配（=, IN）。

特点： - 内存存储，非常快 - 不支持范围查询 - 存在哈希冲突问题

-- 创建哈希索引（MEMORY引擎）
CREATE TABLE hash_table (
    id INT,
    data VARCHAR(100),
    INDEX USING HASH (id)
) ENGINE=MEMORY;

2.3 全文索引

用于文本内容的搜索，支持自然语言搜索和布尔搜索。

-- 创建全文索引
CREATE FULLTEXT INDEX ft_idx_content ON articles(content);

-- 使用全文搜索
SELECT * FROM articles 
WHERE MATCH(content) AGNST('数据库优化');

2.4 空间索引

用于地理空间数据，支持GIS函数查询。

CREATE TABLE spatial_table (
    id INT PRIMARY KEY,
    location GEOMETRY NOT NULL,
    SPATIAL INDEX(location)
);

3. 创建高效索引的原则

3.1 选择合适的列

高选择性列优先： - 区分度高的列（如用户ID比性别更适合建索引） - 常用于WHERE、JOIN、ORDER BY的列

避免索引： - 频繁更新的列 - 区分度低的列（如状态字段只有几个取值） - TEXT/BLOB大字段（考虑前缀索引）

3.2 索引列顺序策略

复合索引列顺序原则： 1. 区分度高的列在前 2. 等值查询列优先于范围查询列 3. 常用排序/分组列放在后面

-- 好的复合索引顺序示例
CREATE INDEX idx_region_status_date ON orders(region, status, order_date);

3.3 避免索引失效

常见导致索引失效的情况： - 使用函数操作：WHERE YEAR(create_time) = 2023 - 隐式类型转换：WHERE user_id = '123'（user_id是INT） - 前导通配符LIKE：WHERE name LIKE '%张' - OR条件不当使用 - 不满足最左前缀原则

4. 实战索引优化技巧

4.1 EXPLN命令详解

分析查询执行计划的关键工具：

EXPLN SELECT * FROM users WHERE age > 30 ORDER BY create_time;

关键字段解读： - type：从最优到最差依次为 system > const > eq_ref > ref > range > index > ALL - key：实际使用的索引 - rows：预估扫描行数 - Extra：重要补充信息（Using index/Using filesort等）

4.2 覆盖索引优化

索引包含查询所需全部字段，避免回表：

-- 创建覆盖索引
CREATE INDEX idx_covering ON products(category, price, name);

-- 查询可以利用覆盖索引
SELECT category, price, name FROM products 
WHERE category = '电子' AND price > 1000;

4.3 索引合并策略

MySQL可能合并多个单列索引：

-- 存在两个单列索引
CREATE INDEX idx_name ON users(name);
CREATE INDEX idx_age ON users(age);

-- 可能使用索引合并
SELECT * FROM users WHERE name = '张三' OR age = 30;

5. 常见索引问题解决方案

5.1 索引选择错误

解决方案： - 使用FORCE INDEX提示 - 更新统计信息：ANALYZE TABLE users - 调整optimizer_switch设置

5.2 索引过多的问题

影响： - 降低写性能 - 增加优化器选择时间 - 占用更多存储空间

优化建议： - 定期审查并删除未使用的索引 - 合并可以合并的索引 - 使用pt-index-usage工具分析

5.3 大数据量表索引优化

策略： - 分区表+本地索引 - 归档历史数据 - 考虑使用NoSQL方案

6. 高级索引策略

6.1 前缀索引

对长字符串列只索引前N个字符：

-- 计算合适的前缀长度
SELECT 
    COUNT(DISTINCT LEFT(email, 5))/COUNT(*) AS selectivity5,
    COUNT(DISTINCT LEFT(email, 10))/COUNT(*) AS selectivity10
FROM users;

-- 创建前缀索引
CREATE INDEX idx_email_prefix ON users(email(10));

6.2 函数索引

MySQL 8.0+支持函数索引：

-- 创建函数索引
CREATE INDEX idx_month ON orders((MONTH(create_date)));

-- 查询使用函数索引
SELECT * FROM orders WHERE MONTH(create_date) = 12;

6.3 自适应哈希索引

InnoDB自动为频繁访问的索引页建立哈希索引，可通过参数调整：

[mysqld]
innodb_adaptive_hash_index=ON
innodb_adaptive_hash_index_parts=8

7. 总结与最佳实践

索引创建黄金法则： 1. 理解业务查询模式 2. 遵循最左前缀原则 3. 优先考虑高选择性列 4. 注意索引维护成本 5. 定期监控和优化

持续优化建议： - 使用Performance Schema监控索引使用 - 定期运行pt-index-usage分析 - 建立索引变更评审流程

最终建议： 索引优化是持续过程，需要结合业务特点、数据分布和查询模式进行针对性设计，没有放之四海而皆准的方案。 “`

注：本文为简化版大纲，完整6800字文章需要扩展每个章节的详细说明、实际案例分析和性能对比测试等内容。实际写作时可补充： 1. 各类索引的内部实现原理图解 2. 真实业务场景的优化案例 3. 不同数据量级的性能测试数据 4. 各版本MySQL的索引特性差异 5. 与索引相关的参数调优建议