用Mybatis手写一个分表插件

发布时间：2021-06-24 10:45:55 作者：chen
来源：亿速云阅读：315

# 用Mybatis手写一个分表插件

## 前言

在大型互联网应用中，单表数据量超过千万级别时，查询性能会显著下降。这时我们通常会采用分表策略将数据分散到多个表中。Mybatis作为Java领域最流行的ORM框架，其插件机制可以优雅地实现分表逻辑。本文将详细讲解如何从零开始手写一个Mybatis分表插件。

## 一、分表技术概述

### 1.1 什么是分表

分表（Sharding）是指按照某种规则（如用户ID、时间等）将一个大表的数据分散存储到多个结构相同的小表中。这些小表可以位于同一个数据库，也可以分布在不同的数据库服务器上。

### 1.2 常见分表策略

1. **水平分表**：按行拆分，每个表存储部分行数据
2. **垂直分表**：按列拆分，每个表存储部分列数据
3. **哈希分表**：通过对分片键取模确定表名
4. **范围分表**：按时间范围或ID范围分表
5. **目录分表**：维护分片键与表的映射关系

### 1.3 Mybatis插件机制

Mybatis提供了强大的插件机制，允许我们在以下四个核心对象的方法执行前后进行拦截：
- Executor (执行器)
- StatementHandler (语句处理器)
- ParameterHandler (参数处理器)
- ResultSetHandler (结果集处理器)

## 二、插件设计思路

### 2.1 总体架构设计

┌──────────────────────────────────────────────────┐ │ Mybatis Sharding Plugin │ ├──────────────────────────────────────────────────┤ │ - 分表策略接口(ShardingStrategy) │ │ - 分表注解(@Sharding) │ │ - SQL重写器(SqlRewriter) │ │ - 分表上下文(ShardingContext) │ └──────────────────────────────────────────────────┘


### 2.2 核心功能点

1. **表名替换**：根据分片键动态替换SQL中的表名
2. **参数解析**：从参数对象中提取分片键值
3. **结果归并**：对跨表查询的结果进行合并
4. **事务支持**：确保分表操作的事务一致性

### 2.3 技术难点

- SQL语法解析与重写
- 分片键值提取策略
- 批量操作的分表处理
- 分布式事务协调

## 三、详细实现步骤

### 3.1 创建Maven项目

```xml
<dependencies>
    <dependency>
        <groupId>org.mybatis</groupId>
        <artifactId>mybatis</artifactId>
        <version>3.5.6</version>
    </dependency>
    <!-- 其他依赖... -->
</dependencies>

3.2 定义分表注解

@Documented
@Retention(RetentionPolicy.RUNTIME)
@Target({ElementType.TYPE, ElementType.METHOD})
public @interface Sharding {
    // 逻辑表名
    String logicTable();
    
    // 分片字段名
    String shardingKey();
    
    // 分表数量
    int tableNum() default 2;
    
    // 分表策略
    Class<? extends ShardingStrategy> strategy();
}

3.3 分表策略接口

public interface ShardingStrategy {
    /**
     * 计算实际表名
     * @param logicTable 逻辑表名
     * @param shardingValue 分片键值
     * @param tableNum 分表数量
     * @return 实际物理表名
     */
    String getActualTableName(String logicTable, Object shardingValue, int tableNum);
}

3.4 哈希分表策略实现

public class HashShardingStrategy implements ShardingStrategy {
    @Override
    public String getActualTableName(String logicTable, Object shardingValue, int tableNum) {
        int hash = shardingValue.hashCode();
        int index = Math.abs(hash % tableNum);
        return logicTable + "_" + index;
    }
}

3.5 范围分表策略实现

public class RangeShardingStrategy implements ShardingStrategy {
    @Override
    public String getActualTableName(String logicTable, Object shardingValue, int tableNum) {
        if (!(shardingValue instanceof Comparable)) {
            throw new IllegalArgumentException("Range strategy requires comparable value");
        }
        Comparable<?> value = (Comparable<?>) shardingValue;
        // 实现具体范围计算逻辑...
        return logicTable + "_" + calculatedIndex;
    }
}

3.6 插件核心实现

@Intercepts({
    @Signature(type = StatementHandler.class, 
               method = "prepare", 
               args = {Connection.class, Integer.class})
})
public class ShardingPlugin implements Interceptor {
    
    private static final Pattern TABLE_PATTERN = Pattern.compile("(\\w+)");

    @Override
    public Object intercept(Invocation invocation) throws Throwable {
        StatementHandler handler = (StatementHandler) invocation.getTarget();
        MetaObject metaObject = SystemMetaObject.forObject(handler);
        
        // 获取Mapper接口和方法信息
        MappedStatement mappedStatement = (MappedStatement) 
            metaObject.getValue("delegate.mappedStatement");
        String mapperId = mappedStatement.getId();
        String className = mapperId.substring(0, mapperId.lastIndexOf("."));
        String methodName = mapperId.substring(mapperId.lastIndexOf(".") + 1);
        
        // 检查分表注解
        Class<?> clazz = Class.forName(className);
        Method method = findMethod(clazz, methodName);
        Sharding sharding = method.getAnnotation(Sharding.class);
        if (sharding == null) {
            return invocation.proceed();
        }
        
        // 获取原始SQL
        BoundSql boundSql = (BoundSql) metaObject.getValue("delegate.boundSql");
        String originalSql = boundSql.getSql();
        
        // 解析分片键值
        Object parameterObject = boundSql.getParameterObject();
        Object shardingValue = resolveShardingValue(parameterObject, sharding.shardingKey());
        
        // 替换表名
        String newSql = rewriteSql(originalSql, sharding, shardingValue);
        metaObject.setValue("delegate.boundSql.sql", newSql);
        
        return invocation.proceed();
    }
    
    // 其他辅助方法...
}

3.7 SQL重写器实现

public class SqlRewriter {
    public static String rewriteTableName(String sql, String logicTable, String actualTable) {
        // 使用正则表达式精确匹配表名
        String regex = "(?i)\\b" + logicTable + "\\b";
        return sql.replaceAll(regex, actualTable);
    }
    
    public static String rewriteInsertSql(String sql, String logicTable, String actualTable) {
        // 处理INSERT语句的特殊情况
        return rewriteTableName(sql, logicTable, actualTable);
    }
    
    // 其他SQL重写方法...
}

3.8 分片键值解析器

public class ShardingValueResolver {
    public static Object resolveShardingValue(Object parameterObject, String shardingKey) {
        if (parameterObject == null) {
            return null;
        }
        
        if (parameterObject instanceof Map) {
            return ((Map<?, ?>) parameterObject).get(shardingKey);
        }
        
        try {
            // 使用反射获取字段值
            Field field = parameterObject.getClass().getDeclaredField(shardingKey);
            field.setAccessible(true);
            return field.get(parameterObject);
        } catch (Exception e) {
            throw new RuntimeException("Failed to resolve sharding value", e);
        }
    }
}

四、高级功能实现

4.1 批量操作支持

// 在ShardingPlugin中添加批量处理逻辑
private String handleBatchSql(String originalSql, Sharding sharding, Object parameterObject) {
    if (!(parameterObject instanceof Collection)) {
        return originalSql;
    }
    
    Collection<?> collection = (Collection<?>) parameterObject;
    if (collection.isEmpty()) {
        return originalSql;
    }
    
    // 获取第一个元素的分表名
    Object firstItem = collection.iterator().next();
    Object shardingValue = resolveShardingValue(firstItem, sharding.shardingKey());
    String actualTable = sharding.strategy().newInstance()
            .getActualTableName(sharding.logicTable(), shardingValue, sharding.tableNum());
    
    // 验证所有元素是否属于同一分表
    for (Object item : collection) {
        Object currentValue = resolveShardingValue(item, sharding.shardingKey());
        String currentTable = sharding.strategy().newInstance()
                .getActualTableName(sharding.logicTable(), currentValue, sharding.tableNum());
        if (!currentTable.equals(actualTable)) {
            throw new IllegalArgumentException("Batch operation must be in same sharding table");
        }
    }
    
    return SqlRewriter.rewriteTableName(originalSql, sharding.logicTable(), actualTable);
}

4.2 跨表查询结果合并

@Intercepts({
    @Signature(type = ResultSetHandler.class,
              method = "handleResultSets",
              args = {Statement.class})
})
public class ShardingResultMergePlugin implements Interceptor {
    
    @Override
    public Object intercept(Invocation invocation) throws Throwable {
        // 获取原始结果
        List<Object> results = (List<Object>) invocation.proceed();
        
        // 如果启用了分表查询且是多表查询
        if (isShardingQuery() && isMultiTableQuery()) {
            return mergeResults(results);
        }
        
        return results;
    }
    
    private List<Object> mergeResults(List<Object> results) {
        // 实现结果合并逻辑
        // ...
    }
}

4.3 分布式事务支持

public class ShardingTransactionManager {
    
    private ThreadLocal<Map<String, Connection>> connectionHolder = new ThreadLocal<>();
    
    public void beginTransaction() {
        // 获取所有分片数据源的连接
        Map<String, Connection> connections = new HashMap<>();
        for (String dsName : shardingDataSources.keySet()) {
            Connection conn = dataSource.getConnection();
            conn.setAutoCommit(false);
            connections.put(dsName, conn);
        }
        connectionHolder.set(connections);
    }
    
    public void commit() {
        try {
            for (Connection conn : connectionHolder.get().values()) {
                conn.commit();
            }
        } catch (SQLException e) {
            rollback();
            throw new RuntimeException(e);
        } finally {
            closeConnections();
        }
    }
    
    // 其他事务方法...
}

五、性能优化策略

5.1 SQL解析优化

缓存解析结果：对SQL解析结果进行缓存
预编译语句重用：相同模式的SQL重用PreparedStatement
减少反射调用：使用字节码增强技术替代反射

5.2 分片路由优化

路由缓存：缓存分片键到实际表的映射关系
批量路由：对批量操作进行统一路由
并行查询：对跨分片查询使用多线程并行执行

5.3 资源管理优化

连接池管理：合理配置分片数据源连接池
结果集流式处理：避免大结果集内存溢出
超时控制：设置合理的查询超时时间

六、完整示例演示

6.1 实体类定义

@Sharding(
    logicTable = "t_order",
    shardingKey = "orderId",
    tableNum = 4,
    strategy = HashShardingStrategy.class
)
public class Order {
    private Long orderId;
    private String userId;
    private BigDecimal amount;
    // getters/setters...
}

6.2 Mapper接口

public interface OrderMapper {
    @Insert("INSERT INTO t_order(order_id, user_id, amount) VALUES(#{orderId}, #{userId}, #{amount})")
    int insert(Order order);
    
    @Select("SELECT * FROM t_order WHERE order_id = #{orderId}")
    Order selectById(@Param("orderId") Long orderId);
    
    @Sharding(
        logicTable = "t_order",
        shardingKey = "userId",
        tableNum = 4,
        strategy = HashShardingStrategy.class
    )
    @Select("SELECT * FROM t_order WHERE user_id = #{userId}")
    List<Order> selectByUserId(@Param("userId") String userId);
}

6.3 Spring集成配置

@Configuration
public class MybatisConfig {
    
    @Bean
    public ShardingPlugin shardingPlugin() {
        return new ShardingPlugin();
    }
    
    @Bean
    public SqlSessionFactory sqlSessionFactory(DataSource dataSource) throws Exception {
        SqlSessionFactoryBean factoryBean = new SqlSessionFactoryBean();
        factoryBean.setDataSource(dataSource);
        factoryBean.setPlugins(new Interceptor[]{shardingPlugin()});
        return factoryBean.getObject();
    }
}

七、测试验证方案

7.1 单元测试

public class ShardingPluginTest {
    
    @Test
    public void testInsertSharding() {
        Order order = new Order();
        order.setOrderId(12345L);
        order.setUserId("user1");
        order.setAmount(new BigDecimal("100.00"));
        
        orderMapper.insert(order);
        
        // 验证数据是否插入到正确的分表
        Order result = orderMapper.selectById(12345L);
        assertNotNull(result);
        assertEquals("user1", result.getUserId());
    }
    
    @Test
    public void testBatchInsert() {
        List<Order> orders = new ArrayList<>();
        for (int i = 0; i < 10; i++) {
            Order order = new Order();
            order.setOrderId(1000L + i);
            order.setUserId("user" + (i % 2));
            orders.add(order);
        }
        
        // 应该抛出异常，因为批量操作不能跨分表
        assertThrows(IllegalArgumentException.class, () -> {
            orderMapper.batchInsert(orders);
        });
    }
}

7.2 性能测试

public class PerformanceTest {
    
    @Test
    public void testShardingPerformance() {
        // 准备10万条测试数据
        List<Order> testData = prepareTestData(100000);
        
        // 测试插入性能
        long start = System.currentTimeMillis();
        for (Order order : testData) {
            orderMapper.insert(order);
        }
        long duration = System.currentTimeMillis() - start;
        System.out.println("Insert 100000 records took: " + duration + "ms");
        
        // 测试查询性能
        start = System.currentTimeMillis();
        for (int i = 0; i < 1000; i++) {
            orderMapper.selectById(testData.get(i).getOrderId());
        }
        duration = System.currentTimeMillis() - start;
        System.out.println("Query 1000 records took: " + duration + "ms");
    }
}

八、生产环境注意事项

8.1 分表键选择原则

高离散度：选择区分度高的字段作为分片键
业务相关性：选择与业务查询密切相关的字段
不可变性：尽量避免使用可能变更的字段

8.2 扩容方案

预分片：初期分配比预期更多的分片数
双写迁移：扩容期间新旧分片同时写入
数据迁移工具：开发专门的数据迁移工具

8.3 监控指标

分片均衡度：各分表数据量是否均衡
跨分片查询比例：监控跨分片操作频率
分片命中率：分片路由的准确率

九、与现有框架对比

9.1 与Sharding-JDBC对比

特性	自定义插件	Sharding-JDBC
学习成本	高	低
灵活性	极高	高
功能完整性	需自行实现	完善
性能	取决于实现	优化良好
维护成本	高	低

9.2 适用场景分析

适合自定义插件的情况： - 有特殊的分片需求 - 需要深度定制 - 希望减少第三方依赖

适合Sharding-JDBC的情况： - 快速实现标准分片功能 - 需要完善的事务支持 - 团队技术储备有限

十、未来扩展方向

10.1 读写分离支持

读操作路由：将读操作路由到从库
写操作路由：写操作必须走主库
数据同步延迟：处理主从同步延迟问题

10.2 多租户支持

租户隔离：按租户ID进行数据隔离
共享schema：同一数据库不同租户共享表结构
独立schema：每个租户有独立的数据schema

10.3 弹性伸缩

动态扩容：运行时增加分片数量
数据再平衡：自动迁移数据到新分片
无感知迁移：应用层不感知分片变化

结语

通过本文的详细讲解，我们实现了一个功能完整的Mybatis分表插件。从基础的分表策略到高级的批量操作支持，从核心的SQL重写到性能优化技巧，涵盖了分表插件开发的各个方面。希望这篇文章能帮助读者深入理解Mybatis插件机制和分表技术，在实际项目中能够灵活应用这些知识。

最佳实践建议： 1. 在简单场景下优先考虑成熟的分库分表框架 2. 复杂定制场景可以考虑自研插件 3. 做好充分的测试验证 4. 建立完善的监控体系

附录

A. 完整代码仓库

GitHub仓库链接

###