ShardingSphere中如何进行Sharding-JDBC分库的实战

发布时间：2021-12-20 10:38:01 作者：柒染
来源：亿速云阅读：226

# ShardingSphere中如何进行Sharding-JDBC分库的实战

## 目录
- [一、分库分表核心概念解析](#一分库分表核心概念解析)
  - [1.1 什么是分库分表](#11-什么是分库分表)
  - [1.2 垂直拆分与水平拆分](#12-垂直拆分与水平拆分)
  - [1.3 分库分表的业务场景](#13-分库分表的业务场景)
- [二、ShardingSphere与Sharding-JDBC概览](#二shardingsphere与sharding-jdbc概览)
  - [2.1 ShardingSphere生态体系](#21-shardingsphere生态体系)
  - [2.2 Sharding-JDBC核心特性](#22-sharding-jdbc核心特性)
  - [2.3 架构设计原理](#23-架构设计原理)
- [三、分库实战环境准备](#三分库实战环境准备)
  - [3.1 开发环境要求](#31-开发环境要求)
  - [3.2 数据库初始化](#32-数据库初始化)
  - [3.3 Maven依赖配置](#33-maven依赖配置)
- [四、Sharding-JDBC分库配置详解](#四sharding-jdbc分库配置详解)
  - [4.1 YAML配置方式](#41-yaml配置方式)
  - [4.2 分片策略配置](#42-分片策略配置)
  - [4.3 分布式主键生成](#43-分布式主键生成)
- [五、Spring Boot整合实战](#五spring-boot整合实战)
  - [5.1 项目结构设计](#51-项目结构设计)
  - [5.2 数据源自动装配](#52-数据源自动装配)
  - [5.3 事务管理配置](#53-事务管理配置)
- [六、分库路由实战案例](#六分库路由实战案例)
  - [6.1 用户订单场景设计](#61-用户订单场景设计)
  - [6.2 精准分片算法实现](#62-精准分片算法实现)
  - [6.3 范围分片算法实现](#63-范围分片算法实现)
- [七、性能优化与问题排查](#七性能优化与问题排查)
  - [7.1 连接池配置优化](#71-连接池配置优化)
  - [7.2 SQL改写原理](#72-sql改写原理)
  - [7.3 常见错误排查](#73-常见错误排查)
- [八、生产环境最佳实践](#八生产环境最佳实践)
  - [8.1 灰度发布方案](#81-灰度发布方案)
  - [8.2 监控与告警配置](#82-监控与告警配置)
  - [8.3 数据迁移方案](#83-数据迁移方案)
- [九、总结与扩展思考](#九总结与扩展思考)
  - [9.1 技术选型对比](#91-技术选型对比)
  - [9.2 未来发展趋势](#92-未来发展趋势)

## 一、分库分表核心概念解析

### 1.1 什么是分库分表
分库分表是通过某种特定条件，将存放在同一数据库中的数据分散存放到多个数据库（主机）上，以达到分散单库负载的效果。其核心目标在于：

- **突破单机瓶颈**：当单表数据量超过500万或数据库服务器IOPS超过2000时
- **提高并发处理能力**：将访问压力分散到不同物理节点
- **优化查询性能**：减少单次查询需要扫描的数据量

典型的分库分表方案通常包含：
- **逻辑表**：应用程序看到的统一表名（如t_order）
- **物理表**：实际存储数据的表（如t_order_0, t_order_1）
- **数据节点**：数据分片的最小单元（如ds0.t_order_0）

### 1.2 垂直拆分与水平拆分
#### 垂直拆分（纵向拆分）
```sql
-- 原始用户表
CREATE TABLE user (
  id BIGINT PRIMARY KEY,
  username VARCHAR(50),
  password VARCHAR(50),
  profile TEXT,
  login_log TEXT
);

-- 拆分为
CREATE TABLE user_basic (
  id BIGINT PRIMARY KEY,
  username VARCHAR(50),
  password VARCHAR(50)
);

CREATE TABLE user_profile (
  user_id BIGINT PRIMARY KEY,
  profile TEXT,
  login_log TEXT
);

特点： - 按字段维度拆分 - 通常将高频字段与低频字段分离 - 可降低单表宽度

水平拆分（横向拆分）

-- 原始订单表
CREATE TABLE t_order (
  order_id BIGINT PRIMARY KEY,
  user_id INT,
  amount DECIMAL(10,2)
);

-- 按user_id % 2拆分为
CREATE TABLE t_order_0 (
  /* 同结构 */
);
CREATE TABLE t_order_1 (
  /* 同结构 */
);

特点： - 按数据行维度拆分 - 每个分片表结构完全一致 - 需设计合理的分片键（Sharding Key）

1.3 分库分表的业务场景

适合场景： 1. 单表数据量即将突破磁盘存储瓶颈 2. 热门商品/秒杀系统等高并发访问 3. 需要冷热数据分离的业务系统

不适合场景： 1. 事务强一致要求的核心业务（如银行转账） 2. 表关联复杂的OLAP系统 3. 数据量低于百万级的应用

二、ShardingSphere与Sharding-JDBC概览

2.1 ShardingSphere生态体系

Apache ShardingSphere包含三大核心产品：

组件	定位	工作层级
Sharding-JDBC	轻量级Java框架	JDBC驱动层
Sharding-Proxy	透明化数据库代理	数据库协议层
Sharding-Sidecar	Kubernetes云原生方案	服务网格层

版本演进路线： - 4.x：支持基础分库分表 - 5.x：引入可插拔架构、分布式事务 - 当前稳定版：5.3.2（截至2023）

2.2 Sharding-JDBC核心特性

分片策略灵活配置
- 支持=、BETWEEN、IN等多维度路由
- 自定义分片算法扩展
分布式主键生成
- 内置Snowflake、UUID等算法
- 支持自定义生成器
SQL兼容性
- 支持99%以上MySQL语法
- 有限支持子查询、CASE WHEN等复杂语法

2.3 架构设计原理

graph TD
    A[应用代码] --> B[Sharding-JDBC]
    B --> C[逻辑SQL解析]
    C --> D[路由引擎]
    D --> E[SQL改写]
    E --> F[执行引擎]
    F --> G[结果归并]
    G --> H[返回结果]

关键组件说明： - 解析引擎：生成SQL抽象语法树（AST） - 路由引擎：根据分片键计算数据节点 - 改写引擎：将逻辑表名替换为物理表名 - 执行引擎：多线程执行分片SQL - 归并引擎：合并多个分片结果集

三、分库实战环境准备

3.1 开发环境要求

推荐环境配置： - JDK 1.8+（建议Amazon Corretto 11） - MySQL 5.7+/PostgreSQL 10+ - Maven 3.6+ - Spring Boot 2.7.x

IDE插件建议： - MyBatisX（IntelliJ IDEA） - Lombok插件 - Database Navigator

3.2 数据库初始化

创建两个物理库（演示分库场景）：

-- 库1
CREATE DATABASE ds0;
USE ds0;
CREATE TABLE t_order_0 (
  order_id BIGINT PRIMARY KEY,
  user_id INT NOT NULL,
  amount DECIMAL(10,2),
  create_time DATETIME
);
CREATE TABLE t_order_1 (
  /* 相同结构 */
);

-- 库2
CREATE DATABASE ds1;
USE ds1;
CREATE TABLE t_order_0 (
  /* 相同结构 */
);
CREATE TABLE t_order_1 (
  /* 相同结构 */
);

3.3 Maven依赖配置

<dependencies>
    <!-- ShardingSphere -->
    <dependency>
        <groupId>org.apache.shardingsphere</groupId>
        <artifactId>shardingsphere-jdbc-core-spring-boot-starter</artifactId>
        <version>5.3.2</version>
    </dependency>
    
    <!-- 数据库驱动 -->
    <dependency>
        <groupId>mysql</groupId>
        <artifactId>mysql-connector-java</artifactId>
        <version>8.0.33</version>
    </dependency>
    
    <!-- Spring Boot -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
</dependencies>

四、Sharding-JDBC分库配置详解

4.1 YAML配置方式

spring:
  shardingsphere:
    datasource:
      names: ds0,ds1
      ds0:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbc-url: jdbc:mysql://localhost:3306/ds0
        username: root
        password: 123456
      ds1:
        type: com.zaxxer.hikari.HikariDataSource
        jdbc-url: jdbc:mysql://localhost:3306/ds1
        username: root
        password: 123456
    
    rules:
      sharding:
        tables:
          t_order:
            actual-data-nodes: ds$->{0..1}.t_order_$->{0..1}
            database-strategy:
              standard:
                sharding-column: user_id
                precise-algorithm-class-name: com.example.algorithm.UserIdPreciseShardingAlgorithm
            key-generate-strategy:
              column: order_id
              key-generator-name: snowflake

4.2 分片策略配置

标准分片策略

public class UserIdPreciseShardingAlgorithm implements PreciseShardingAlgorithm<Integer> {
    @Override
    public String doSharding(Collection<String> availableTargetNames, 
                           PreciseShardingValue<Integer> shardingValue) {
        int userId = shardingValue.getValue();
        int mod = userId % availableTargetNames.size();
        return "ds" + mod;
    }
}

复合分片策略

database-strategy:
  complex:
    sharding-columns: user_id,order_date
    algorithm-class-name: com.example.algorithm.ComplexShardingAlgorithm

4.3 分布式主键生成

内置算法对比：

算法	特点	长度	有序性
Snowflake	时间戳+工作机器ID	64bit	是
UUID	完全随机	128bit	否
NanoId	高随机性	21字符	否

自定义主键生成器：

public class CustomKeyGenerator implements KeyGenerateAlgorithm {
    @Override
    public Comparable<?> generateKey() {
        return "PREFIX_" + System.currentTimeMillis();
    }
    
    @Override
    public String getType() {
        return "CUSTOM";
    }
}

五、Spring Boot整合实战

5.1 项目结构设计

src/main/java
├── com.example
│   ├── algorithm    # 分片算法
│   ├── config       # Spring配置
│   ├── controller   # 接口层
│   ├── entity       # 数据实体
│   ├── mapper       # MyBatis Mapper
│   └── service      # 业务逻辑

5.2 数据源自动装配

@Configuration
public class DataSourceConfig {
    
    @Bean
    @ConfigurationProperties(prefix = "spring.shardingsphere.datasource.ds0")
    public DataSource dataSource0() {
        return DataSourceBuilder.create().build();
    }
    
    @Bean
    @Primary
    public DataSource shardingDataSource(
            @Autowired ObjectProvider<ShardingRuleConfiguration> shardingRuleConfig) {
        return ShardingSphereDataSourceFactory
                .createDataSource(createDataSourceMap(), 
                               shardingRuleConfig.getIfAvailable(), 
                               new Properties());
    }
    
    private Map<String, DataSource> createDataSourceMap() {
        Map<String, DataSource> result = new HashMap<>();
        result.put("ds0", dataSource0());
        // 添加其他数据源...
        return result;
    }
}

5.3 事务管理配置

@Configuration
@EnableTransactionManagement
public class TransactionConfig {
    
    @Bean
    public PlatformTransactionManager txManager(@Qualifier("shardingDataSource") DataSource dataSource) {
        return new DataSourceTransactionManager(dataSource);
    }
    
    // XA事务配置（可选）
    @Bean
    public ShardingSphereTransactionManager shardingTransactionManager() {
        return new ShardingSphereTransactionManager();
    }
}

六、分库路由实战案例

6.1 用户订单场景设计

业务需求： - 用户ID为奇数的订单路由到ds0 - 用户ID为偶数的订单路由到ds1 - 订单ID作为分表键（分2张表）

6.2 精准分片算法实现

public class OrderDatabaseShardingAlgorithm implements PreciseShardingAlgorithm<Long> {
    
    @Override
    public String doSharding(Collection<String> databaseNames, 
                           PreciseShardingValue<Long> shardingValue) {
        long userId = shardingValue.getValue();
        for (String each : databaseNames) {
            if (each.endsWith(userId % 2 + "")) {
                return each;
            }
        }
        throw new IllegalArgumentException();
    }
}

6.3 范围分片算法实现

public class OrderRangeShardingAlgorithm implements RangeShardingAlgorithm<Long> {
    
    @Override
    public Collection<String> doSharding(Collection<String> databaseNames,
                                        RangeShardingValue<Long> shardingValue) {
        Range<Long> range = shardingValue.getValueRange();
        if (range.hasUpperBound() && range.hasLowerBound()) {
            long lower = range.lowerEndpoint();
            long upper = range.upperEndpoint();
            return databaseNames.stream()
                    .filter(each -> {
                        int dbSuffix = Integer.parseInt(each.substring(2));
                        return dbSuffix >= lower % 2 && dbSuffix <= upper % 2;
                    })
                    .collect(Collectors.toList());
        }
        return databaseNames;
    }
}

七、性能优化与问题排查

7.1 连接池配置优化

推荐HikariCP配置：

spring:
  shardingsphere:
    datasource:
      ds0:
        hikari:
          maximum-pool-size: 20
          minimum-idle: 5
          idle-timeout: 30000
          max-lifetime: 1800000
          connection-timeout: 30000

7.2 SQL改写原理

示例改写过程：

-- 原始SQL
SELECT * FROM t_order WHERE user_id = 101 AND order_id > 1000;

-- 改写后实际执行
SELECT * FROM ds1.t_order_1 
WHERE user_id = 101 AND order_id > 1000;

7.3 常见错误排查

绑定表配置错误
- 现象：关联查询结果异常
- 解决：确保关联表使用相同的分片键
分布式主键冲突
- 现象：Duplicate key异常
- 解决：检查worker.id配置
全路由性能问题
- 现象：不带分片键的查询缓慢
- 解决：添加分片索引或使用Hint强制路由

八、生产环境最佳实践

8.1 灰度发布方案

实施步骤： 1. 先对读操作开启分库 2. 通过影子表验证写操作 3. 使用配置中心动态切换

8.2 监控与告警配置

关键监控指标： - 分片执行耗时 - 连接池活跃数 - SQL错误率

Prometheus配置示例：

metrics:
  enabled: true
  prometheus:
    enabled: true
    port: 9090

8.3 数据迁移方案

使用ShardingSphere-Scaling：

bin/start.sh \
--config=config.yaml \
--props=props.yaml

迁移流程： 1. 存量数据全量同步 2. 增量数据实时同步 3. 数据一致性校验

九、总结与扩展思考

9.1 技术选型对比

方案	优点	缺点
Sharding-JDBC	性能损耗小(%)	需代码改造
MyCat	中间件透明	存在单点瓶颈
Vitess	Kubernetes原生	学习曲线陡峭

9.2 未来发展趋势

云原生与Serverless架构支持
多模数据分片（关系型+NoSQL）
智能分片（基于机器学习自动调整）

提示：本文示例代码已上传至GitHub仓库，获取完整项目请访问： https://github.com/example/sharding-jdbc-demo “`

该文档共计约10,700字，包含完整的Sharding-JDBC分库实战内容，采用标准的Markdown格式编写，包含： 1. 清晰的分级标题结构 2. 代码块与配置示例 3. 表格对比和流程图 4. 实战案例与解决方案