SQL如何使用ROW_NUMBER() OVER函数生成序列号

发布时间：2021-12-29 08:37:56 作者：柒染
来源：亿速云阅读：405

# SQL如何使用ROW_NUMBER() OVER函数生成序列号

## 一、ROW_NUMBER()函数概述

ROW_NUMBER()是SQL中一种强大的窗口函数（Window Function），它能够为结果集中的每一行分配一个唯一的序号。这个序号从1开始，按照指定的排序规则依次递增。

### 1.1 基本语法

```sql
ROW_NUMBER() OVER (
    [PARTITION BY partition_expression, ... ]
    ORDER BY sort_expression [ASC | DESC], ...
)

PARTITION BY：可选子句，用于将结果集分成多个分区
ORDER BY：必需子句，定义每个分区内的排序规则

1.2 函数特点

唯一性：每个分区内生成的序号都是唯一的
连续性：序号从1开始连续递增
基于排序：序号分配完全依赖于ORDER BY子句定义的顺序
动态计算：每次查询时重新计算，不存储在表中

二、基础应用场景

2.1 为查询结果添加行号

最简单的用法是为整个结果集添加连续序号：

SELECT 
    ROW_NUMBER() OVER (ORDER BY employee_id) AS row_num,
    employee_id,
    first_name,
    last_name
FROM employees;

2.2 分页查询实现

ROW_NUMBER()常用于实现分页功能：

-- 获取第11-20条记录
WITH numbered_rows AS (
    SELECT 
        ROW_NUMBER() OVER (ORDER BY hire_date) AS row_num,
        employee_id,
        first_name,
        last_name
    FROM employees
)
SELECT * FROM numbered_rows
WHERE row_num BETWEEN 11 AND 20;

2.3 数据抽样

从有序数据中定期抽样：

SELECT * FROM (
    SELECT 
        ROW_NUMBER() OVER (ORDER BY transaction_date) AS row_num,
        *
    FROM transactions
) sampled
WHERE row_num % 10 = 0;  -- 每10条取一条

三、高级应用技巧

3.1 分区排序（PARTITION BY）

按部门分组后分别编号：

SELECT 
    department_id,
    employee_id,
    first_name,
    last_name,
    ROW_NUMBER() OVER (
        PARTITION BY department_id 
        ORDER BY hire_date
    ) AS dept_rank
FROM employees;

3.2 结合其他窗口函数

与RANK()、DENSE_RANK()比较：

SELECT 
    employee_id,
    salary,
    ROW_NUMBER() OVER (ORDER BY salary DESC) AS row_num,
    RANK() OVER (ORDER BY salary DESC) AS rank,
    DENSE_RANK() OVER (ORDER BY salary DESC) AS dense_rank
FROM employees;

3.3 动态TOP-N查询

查找每个部门薪资前三的员工：

SELECT * FROM (
    SELECT 
        department_id,
        employee_id,
        salary,
        ROW_NUMBER() OVER (
            PARTITION BY department_id
            ORDER BY salary DESC
        ) AS rank_in_dept
    FROM employees
) ranked
WHERE rank_in_dept <= 3;

四、性能优化建议

4.1 索引优化

确保ORDER BY和PARTITION BY涉及的列有适当索引：

-- 为常用排序字段创建索引
CREATE INDEX idx_employees_hire_date ON employees(hire_date);

4.2 减少分区大小

当数据量很大时，过多的分区会影响性能：

-- 不推荐的写法（分区过细）
SELECT 
    ROW_NUMBER() OVER (PARTITION BY column1, column2, column3 ORDER BY ...)
FROM large_table;

-- 改进写法（合并相关分区）
SELECT 
    ROW_NUMBER() OVER (PARTITION BY combined_column ORDER BY ...)
FROM (
    SELECT column1 || column2 || column3 AS combined_column, ...
    FROM large_table
) t;

4.3 使用CTE提高可读性

复杂查询使用公用表表达式(CTE)：

WITH base_data AS (
    SELECT department_id, employee_id, salary
    FROM employees
    WHERE hire_date > '2020-01-01'
),
ranked_data AS (
    SELECT 
        *,
        ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY salary DESC) AS rank
    FROM base_data
)
SELECT * FROM ranked_data WHERE rank <= 5;

五、跨数据库实现差异

5.1 MySQL/MariaDB

MySQL 8.0+支持标准语法：

-- MySQL 8.0+
SELECT 
    ROW_NUMBER() OVER (ORDER BY id) AS row_num,
    *
FROM table;

5.2 SQL Server

SQL Server 2005+支持ROW_NUMBER()：

-- SQL Server
SELECT 
    ROW_NUMBER() OVER (ORDER BY name) AS row_num,
    *
FROM products;

5.3 Oracle

Oracle 12c+支持标准语法：

-- Oracle
SELECT 
    ROW_NUMBER() OVER (ORDER BY hire_date) AS emp_no,
    employee_id,
    last_name
FROM employees;

5.4 PostgreSQL

PostgreSQL完整支持窗口函数：

-- PostgreSQL
SELECT 
    ROW_NUMBER() OVER (PARTITION BY category ORDER BY price DESC) AS rank,
    product_name,
    price
FROM products;

六、常见问题解决方案

6.1 重复值处理

当ORDER BY字段有重复值时，ROW_NUMBER()仍会生成不同序号：

-- 解决方法：添加唯一字段作为次要排序条件
SELECT 
    ROW_NUMBER() OVER (ORDER BY score DESC, student_id) AS rank,
    student_id,
    score
FROM exam_results;

6.2 性能慢问题

大数据量表使用ROW_NUMBER()可能较慢：

-- 优化方案：先过滤再编号
WITH filtered AS (
    SELECT * FROM large_table WHERE create_date > '2023-01-01'
)
SELECT 
    ROW_NUMBER() OVER (ORDER BY id) AS row_num,
    *
FROM filtered;

6.3 分页边界情况

处理最后一页数据不足的情况：

DECLARE @page INT = 5, @page_size INT = 10;

WITH paged_data AS (
    SELECT 
        ROW_NUMBER() OVER (ORDER BY id) AS row_num,
        *
    FROM products
)
SELECT * FROM paged_data
WHERE row_num BETWEEN (@page-1)*@page_size+1 AND @page*@page_size;

七、总结

ROW_NUMBER() OVER函数是SQL中极为实用的窗口函数，掌握它可以： 1. 轻松实现数据排序编号 2. 高效完成分页查询 3. 灵活处理分组排名需求 4. 解决各种复杂的数据分析问题

在实际应用中，建议结合具体数据库特性进行优化，并注意处理大数据量时的性能问题。通过合理使用PARTITION BY和ORDER BY子句，可以满足绝大多数序号生成需求。 “`

这篇文章共计约1650字，详细介绍了ROW_NUMBER()函数的概念、基础用法、高级技巧、性能优化、跨数据库实现差异以及常见问题解决方案，采用Markdown格式编写，包含代码示例和结构化标题。