Hive中的group_concat是一个聚合函数,它可以将同一组中的所有非空值连接成一个字符串
- COUNT:计算组中的行数。
- SUM:计算组中所有数值的总和。
- AVG:计算组中所有数值的平均值。
- MIN:找到组中的最小值。
- MAX:找到组中的最大值。
- AVG(DISTINCT):计算组中所有不同数值的平均值。
- SUM(DISTINCT):计算组中所有不同数值的总和。
- COUNT(DISTINCT):计算组中不同行数。
- FIRST_VALUE:返回组中的第一个值。
- LAST_VALUE:返回组中的最后一个值。
- LAG(column, offset, default):返回指定偏移量的列值,如果不存在则返回默认值。
- LEAD(column, offset, default):返回指定偏移量的列值,如果不存在则返回默认值。
- RANK():计算组中的行排名。
- DENSE_RANK():计算组中的行排名,不跳过相同的排名。
- ROW_NUMBER():计算组中的行编号。
这些聚合函数与group_concat的不同之处在于,它们计算的是数值或行之间的统计信息,而group_concat则是将同一组中的所有非空值连接成一个字符串。在某些情况下,您可以将group_concat与其他聚合函数结合使用,以便在一个查询中获取所需的信息。