在Pandas中,resample方法用于重新采样时间序列数据。
使用resample方法的一般语法如下:
df.resample(rule, how, axis, fill_method, closed, label)
其中,常用参数的含义如下:
rule:重新采样的规则。可以是字符串(如’5Min’表示每5分钟重新采样一次)或pandas.DateOffset对象。
how:重新采样的方法。可以是函数名(如’mean’表示求均值)或字符串(如’sum’表示求和)。
axis:重新采样的轴。0表示按行重新采样,1表示按列重新采样。默认为0。
fill_method:填充方法。对于重采样频率增大的情况,可以使用’ffill’或’bfill’进行前向或后向填充。默认为None。
closed:规定区间的开闭情况。'left’表示区间左闭右开(默认),'right’表示区间左开右闭。
label:重新采样后的时间标签位置。'left’表示取区间左边界作为标签(默认),'right’表示取区间右边界作为标签。
下面是一个使用resample方法重新采样时间序列数据的示例:
import pandas as pd
# 创建一个时间序列数据
data = pd.Series([1, 2, 3, 4, 5], index=pd.date_range('2021-01-01', periods=5, freq='D'))
# 按周重新采样,求和
resampled_data = data.resample('W').sum()
print(resampled_data)
输出结果为:
2021-01-03 6
2021-01-10 9
Freq: W-SUN, dtype: int64
在上述示例中,我们创建了一个包含5个元素的时间序列数据data,并将其按周重新采样,并求和得到resampled_data。