在Pandas中,可以使用groupby
方法来实现数据聚合。具体步骤如下:
groupby
方法对数据进行分组,根据需要聚合的列进行分组。sum()
、mean()
、count()
等。agg()
方法同时应用多种聚合函数。reset_index()
方法将分组后的数据重新设置索引。下面是一个简单的示例:
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Alice', 'Bob', 'Alice'],
'Score': [85, 90, 88, 92, 87],
'Age': [25, 30, 25, 30, 25]}
df = pd.DataFrame(data)
# 按照Name列进行分组,并计算每个人的平均分和总分
grouped = df.groupby('Name').agg({'Score': ['mean', 'sum'], 'Age': 'count'})
grouped = grouped.reset_index()
print(grouped)
运行以上代码,输出结果如下:
Name Score Age
mean sum count
0 Alice 86.7 261 3
1 Bob 91.0 182 2