在Python的pandas库中,fillna()
函数用于填充缺失值。这个函数有多种方法可以填充缺失值,包括使用常数、前一个值、后一个值或插值方法等。
以下是一些使用fillna()
函数的例子:
import pandas as pd
# 创建一个包含缺失值的DataFrame
data = {'A': [1, 2, None, 4], 'B': [None, 2, 3, 4]}
df = pd.DataFrame(data)
# 使用常数值填充缺失值,例如0
df_filled = df.fillna(0)
df_filled = df.fillna(method='ffill')
df_filled = df.fillna(method='bfill')
df_filled = df.interpolate()
df_filled = df.fillna(method='ffill', limit=1)
这里的limit=1
表示只使用前一个值填充,如果前一个值也是缺失值,则不进行填充。
需要注意的是,fillna()
函数默认会返回一个新的DataFrame,原始的DataFrame不会被修改。如果需要直接修改原始的DataFrame,可以使用inplace=True
参数:
df.fillna(0, inplace=True)
这样,原始的DataFrame就会被修改,所有的缺失值都会被填充为0。