在SQL中,collect_set
函数用于收集给定列中不重复的值,并将这些值存储为一个集合。通常用于对数据进行去重操作。
语法如下:
collect_set(column_name)
示例:
假设有一个表employee
,包含department_id
和employee_name
两列数据,现在想要查找每个部门中的唯一员工姓名,可以使用collect_set
函数进行操作:
SELECT department_id, collect_set(employee_name) as unique_employees
FROM employee
GROUP BY department_id;
在上面的示例中,collect_set(employee_name)
将返回每个部门中唯一的员工姓名集合。