fillna()
函数是 Pandas 库中的一个重要函数,用于填充 DataFrame 或 Series 中的缺失值(NaN)
使用特定值填充:
你可以使用 fillna()
函数将缺失值替换为特定值。例如,将所有缺失值替换为 0:
df.fillna(0, inplace=True)
使用前一个值填充:
你可以使用 fillna()
函数将缺失值替换为前一个值。例如,使用前一个值填充:
df.fillna(method='ffill', inplace=True)
使用后一个值填充:
你可以使用 fillna()
函数将缺失值替换为后一个值。例如,使用后一个值填充:
df.fillna(method='bfill', inplace=True)
使用平均值填充:
你可以使用 fillna()
函数将缺失值替换为列的平均值。例如,使用平均值填充:
df.fillna(df.mean(), inplace=True)
使用限制填充:
你可以使用 fillna()
函数将缺失值替换为前一个值或后一个值,直到达到指定的限制。例如,使用前一个值填充,最多填充 3 个连续缺失值:
df.fillna(method='ffill', limit=3, inplace=True)
使用插值填充:
你可以使用 fillna()
函数将缺失值替换为插值。例如,使用线性插值填充:
df.fillna(method='linear', inplace=True)
使用自定义函数填充:
你可以使用 fillna()
函数将缺失值替换为自定义函数的结果。例如,使用自定义函数填充:
def custom_function(x):
return x * 2
df.fillna(df.applymap(custom_function), inplace=True)
这些只是 fillna()
函数的一些使用技巧。根据你的需求,你可以选择合适的方法来处理缺失值。