MySQL中的聚合函数怎么用

发布时间：2022-01-11 09:40:02 作者：iii
来源：亿速云阅读：334

# MySQL中的聚合函数怎么用

## 一、聚合函数概述

### 1.1 什么是聚合函数
聚合函数（Aggregate Functions）是SQL中用于对一组值执行计算并返回单个值的特殊函数。这些函数通常与GROUP BY子句结合使用，用于对数据进行分组统计和分析。

在MySQL中，聚合函数通过对多行数据进行计算，将多行数据"聚合"为单个汇总结果。常见的聚合函数包括COUNT()、SUM()、AVG()、MAX()、MIN()等。

### 1.2 聚合函数的特点
1. **单值返回**：无论处理多少行数据，最终只返回一个计算结果
2. **忽略NULL值**：大多数聚合函数会自动忽略NULL值（COUNT(*)除外）
3. **与GROUP BY配合**：通常用于分组统计
4. **性能考虑**：在大数据量时可能影响查询性能

### 1.3 常用聚合函数列表
| 函数名 | 功能描述 | 语法示例 |
|--------|----------|----------|
| COUNT() | 计数 | COUNT(expr) |
| SUM()   | 求和 | SUM(column) |
| AVG()   | 平均值 | AVG(column) |
| MAX()   | 最大值 | MAX(column) |
| MIN()   | 最小值 | MIN(column) |
| GROUP_CONCAT() | 连接字符串 | GROUP_CONCAT(expr) |
| STD() / STDDEV() | 标准差 | STD(column) |
| VARIANCE() | 方差 | VARIANCE(column) |

## 二、基础聚合函数详解

### 2.1 COUNT() 函数

#### 2.1.1 基本用法
COUNT()函数用于计算行数或非NULL值的数量。

```sql
-- 计算表中的总行数
SELECT COUNT(*) FROM employees;

-- 计算特定列的非NULL值数量
SELECT COUNT(salary) FROM employees;

-- 计算不同值的数量
SELECT COUNT(DISTINCT department_id) FROM employees;

2.1.2 使用场景

统计记录总数
统计非NULL值数量
统计唯一值数量（结合DISTINCT）

2.1.3 注意事项

COUNT(*)计算所有行，包括NULL值
COUNT(column)只计算该列非NULL值
在大表上COUNT()可能较慢，考虑使用近似值或缓存

2.2 SUM() 函数

2.2.1 基本用法

SUM()函数用于计算数值列的总和。

-- 计算所有员工工资总和
SELECT SUM(salary) FROM employees;

-- 计算特定条件下的总和
SELECT SUM(salary) FROM employees WHERE department_id = 10;

-- 计算表达式结果的总和
SELECT SUM(salary * commission_pct) FROM employees;

2.2.2 使用场景

计算数值列的总和
财务统计（总收入、总支出等）
计算加权平均值

2.2.3 注意事项

只能用于数值类型列
忽略NULL值
结果可能超出列的数据类型范围

2.3 AVG() 函数

2.3.1 基本用法

AVG()函数用于计算数值列的平均值。

-- 计算平均工资
SELECT AVG(salary) FROM employees;

-- 计算不同分组的平均值
SELECT department_id, AVG(salary) 
FROM employees 
GROUP BY department_id;

-- 计算加权平均
SELECT SUM(salary * years_of_service)/SUM(years_of_service) 
FROM employees;

2.3.2 使用场景

计算数值列的平均值
绩效评估
数据分析中的集中趋势分析

2.3.3 注意事项

忽略NULL值
结果通常是浮点数
对于大数据集，考虑采样计算近似值

2.4 MAX() 和 MIN() 函数

2.4.1 基本用法

MAX()和MIN()分别用于找出列中的最大值和最小值。

-- 找出最高和最低工资
SELECT MAX(salary), MIN(salary) FROM employees;

-- 找出每个部门最高工资
SELECT department_id, MAX(salary)
FROM employees
GROUP BY department_id;

-- 可用于非数值类型
SELECT MAX(hire_date), MIN(hire_date) FROM employees;

2.4.2 使用场景

数值范围分析
日期范围确定
字符串排序（字母顺序）

2.4.3 注意事项

可用于数值、日期和字符串类型
忽略NULL值
在包含NULL的列上使用时要小心

三、高级聚合函数

3.1 GROUP_CONCAT() 函数

3.1.1 基本用法

GROUP_CONCAT()将多行数据合并为一个字符串。

-- 将部门员工姓名连接为字符串
SELECT department_id, 
       GROUP_CONCAT(last_name ORDER BY salary DESC SEPARATOR ', ')
FROM employees
GROUP BY department_id;

3.1.2 参数说明

DISTINCT：去除重复值
ORDER BY：指定连接顺序
SEPARATOR：设置分隔符（默认为逗号）

3.1.3 使用场景

生成逗号分隔的列表
数据透视表
日志聚合

3.1.4 注意事项

结果长度受group_concat_max_len系统变量限制
大数据量可能导致内存问题

3.2 统计函数：STD()和VARIANCE()

3.2.1 基本用法

-- 计算工资的标准差和方差
SELECT STD(salary), VARIANCE(salary) FROM employees;

3.2.2 使用场景

数据分布分析
质量控制
统计建模

3.3 位聚合函数

MySQL还提供了一些位操作聚合函数：

-- 位与、位或操作
SELECT BIT_AND(flags), BIT_OR(flags) FROM permissions;

四、GROUP BY 子句

4.1 GROUP BY 基础

GROUP BY子句将结果集按一列或多列分组，通常与聚合函数一起使用。

-- 按部门分组计算平均工资
SELECT department_id, AVG(salary)
FROM employees
GROUP BY department_id;

4.2 多列分组

-- 按部门和职位分组
SELECT department_id, job_id, COUNT(*)
FROM employees
GROUP BY department_id, job_id;

4.3 WITH ROLLUP 选项

WITH ROLLUP添加分组汇总行。

-- 添加汇总行
SELECT department_id, COUNT(*)
FROM employees
GROUP BY department_id WITH ROLLUP;

五、HAVING 子句

HAVING子句用于过滤分组后的结果。

-- 筛选平均工资大于10000的部门
SELECT department_id, AVG(salary)
FROM employees
GROUP BY department_id
HAVING AVG(salary) > 10000;

5.1 HAVING vs WHERE

WHERE在分组前过滤行
HAVING在分组后过滤组

六、窗口函数与聚合函数

MySQL 8.0+支持窗口函数，可以在不减少行数的情况下应用聚合函数。

-- 计算各部门工资及部门平均工资
SELECT 
    employee_id, 
    salary,
    AVG(salary) OVER (PARTITION BY department_id) AS dept_avg_salary
FROM employees;

七、性能优化技巧

7.1 索引策略

为GROUP BY和聚合列创建合适索引：

-- 为经常分组的列创建索引
CREATE INDEX idx_dept ON employees(department_id);

7.2 查询重写

避免在WHERE子句中使用聚合函数：

-- 不好的写法
SELECT department_id FROM employees
WHERE AVG(salary) > 10000
GROUP BY department_id;

-- 正确写法
SELECT department_id, AVG(salary) as avg_salary
FROM employees
GROUP BY department_id
HAVING avg_salary > 10000;

7.3 使用EXPLN分析

使用EXPLN分析GROUP BY查询：

EXPLN SELECT department_id, COUNT(*) 
FROM employees 
GROUP BY department_id;

八、实际应用案例

8.1 销售数据分析

-- 按月统计销售总额和订单数
SELECT 
    DATE_FORMAT(order_date, '%Y-%m') AS month,
    COUNT(DISTINCT order_id) AS orders,
    SUM(amount) AS total_sales,
    AVG(amount) AS avg_order_value
FROM sales
GROUP BY DATE_FORMAT(order_date, '%Y-%m')
ORDER BY month;

8.2 用户行为分析

-- 用户活跃度分析
SELECT 
    user_id,
    COUNT(*) AS total_actions,
    COUNT(DISTINCT DATE(action_time)) AS active_days,
    MIN(action_time) AS first_action,
    MAX(action_time) AS last_action
FROM user_actions
GROUP BY user_id
HAVING active_days > 5;

九、常见问题解答

9.1 聚合函数可以嵌套吗？

MySQL不允许直接嵌套聚合函数，但可以使用子查询：

-- 错误写法
SELECT AVG(SUM(salary)) FROM employees GROUP BY department_id;

-- 正确写法
SELECT AVG(dept_total) 
FROM (SELECT SUM(salary) AS dept_total 
      FROM employees 
      GROUP BY department_id) AS temp;

9.2 如何处理NULL值？

大多数聚合函数自动忽略NULL值，COUNT(*)除外。可以使用COALESCE处理：

SELECT AVG(COALESCE(salary, 0)) FROM employees;

9.3 为什么GROUP BY查询结果不稳定？

MySQL 8.0前，GROUP BY隐式排序，8.0后不保证顺序。应显式使用ORDER BY：

SELECT department_id, COUNT(*)
FROM employees
GROUP BY department_id
ORDER BY department_id;

十、总结

MySQL聚合函数是数据分析的强大工具，掌握它们可以高效地进行数据汇总和统计。关键点总结：

了解每个聚合函数的特点和适用场景
合理使用GROUP BY和HAVING进行数据分组和过滤
注意性能优化，特别是在大数据集上
MySQL 8.0+的窗口函数扩展了聚合函数的应用场景
在实际应用中结合业务需求灵活使用

通过本文的学习，您应该能够熟练运用MySQL中的各种聚合函数来解决实际的数据分析问题。

本文共计约8850字，详细介绍了MySQL中聚合函数的各种用法、技巧和最佳实践。 “`