pandas如何添加新列

发布时间：2022-06-13 11:46:08 作者：zzz
来源：亿速云阅读：448

pandas如何添加新列

在数据处理和分析中，pandas 是一个非常强大的 Python 库。它提供了丰富的数据结构和函数，使得数据的操作变得简单而高效。在实际应用中，我们经常需要向现有的 DataFrame 中添加新的列。本文将详细介绍如何使用 pandas 添加新列，并探讨几种常见的方法。

1. 直接赋值法

最直接的方法是使用赋值操作符 = 来添加新列。假设我们有一个 DataFrame df，我们可以通过以下方式添加新列：

import pandas as pd

# 创建一个示例 DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6]
}
df = pd.DataFrame(data)

# 添加新列 'C'
df['C'] = [7, 8, 9]

print(df)

输出结果：

在这个例子中，我们通过 df['C'] = [7, 8, 9] 直接为 DataFrame 添加了一个新列 C。

2. 使用 `assign` 方法

pandas 提供了 assign 方法，可以方便地添加新列。assign 方法返回一个新的 DataFrame，原始 DataFrame 不会被修改。

# 使用 assign 方法添加新列
df_new = df.assign(D=[10, 11, 12])

print(df_new)

输出结果：

   A  B  C   D
0  1  4  7  10
1  2  5  8  11
2  3  6  9  12

在这个例子中，我们使用 assign 方法添加了一个新列 D，并将结果赋值给 df_new。

3. 使用 `insert` 方法

insert 方法允许我们在指定的位置插入新列。这个方法会直接修改原始 DataFrame。

# 使用 insert 方法在指定位置插入新列
df.insert(1, 'E', [13, 14, 15])

print(df)

输出结果：

   A   E  B  C
0  1  13  4  7
1  2  14  5  8
2  3  15  6  9

在这个例子中，我们在第 1 列的位置插入了一个新列 E。

4. 基于现有列的计算

有时候，我们需要基于现有列的值来计算新列的值。例如，我们可以通过以下方式添加一个新列 F，其值为列 A 和列 B 的和：

# 基于现有列的计算添加新列
df['F'] = df['A'] + df['B']

print(df)

输出结果：

   A   E  B  C   F
0  1  13  4  7   5
1  2  14  5  8   7
2  3  15  6  9   9

在这个例子中，我们通过 df['A'] + df['B'] 计算了新列 F 的值。

5. 使用 `apply` 方法

apply 方法可以用于对 DataFrame 的每一行或每一列应用一个函数，从而生成新列。例如，我们可以使用 apply 方法添加一个新列 G，其值为列 A 的平方：

# 使用 apply 方法添加新列
df['G'] = df['A'].apply(lambda x: x ** 2)

print(df)

输出结果：

   A   E  B  C   F   G
0  1  13  4  7   5   1
1  2  14  5  8   7   4
2  3  15  6  9   9   9

在这个例子中，我们使用 apply 方法对列 A 的每个元素进行平方运算，并将结果赋值给新列 G。

6. 使用 `concat` 方法

concat 方法可以用于将多个 DataFrame 或 Series 沿指定轴连接起来。我们可以使用 concat 方法将一个 Series 作为新列添加到 DataFrame 中。

# 创建一个 Series
new_column = pd.Series([16, 17, 18], name='H')

# 使用 concat 方法添加新列
df = pd.concat([df, new_column], axis=1)

print(df)

输出结果：

   A   E  B  C   F   G   H
0  1  13  4  7   5   1  16
1  2  14  5  8   7   4  17
2  3  15  6  9   9   9  18

在这个例子中，我们使用 concat 方法将一个 Series new_column 作为新列 H 添加到 DataFrame df 中。

7. 使用 `merge` 方法

merge 方法可以用于根据一个或多个键将两个 DataFrame 合并。我们可以使用 merge 方法将一个 DataFrame 作为新列添加到另一个 DataFrame 中。

# 创建另一个 DataFrame
data2 = {
    'A': [1, 2, 3],
    'I': [19, 20, 21]
}
df2 = pd.DataFrame(data2)

# 使用 merge 方法添加新列
df = df.merge(df2, on='A')

print(df)

输出结果：

   A   E  B  C   F   G   H   I
0  1  13  4  7   5   1  16  19
1  2  14  5  8   7   4  17  20
2  3  15  6  9   9   9  18  21

在这个例子中，我们使用 merge 方法将 df2 作为新列 I 添加到 df 中。

总结

本文介绍了多种在 pandas 中添加新列的方法，包括直接赋值法、assign 方法、insert 方法、基于现有列的计算、apply 方法、concat 方法和 merge 方法。每种方法都有其适用的场景，选择合适的方法可以大大提高数据处理的效率。希望本文能帮助读者更好地理解和使用 pandas 添加新列的功能。

pandas如何添加新列

pandas如何添加新列

1. 直接赋值法

2. 使用 assign 方法

3. 使用 insert 方法

4. 基于现有列的计算

5. 使用 apply 方法

6. 使用 concat 方法

7. 使用 merge 方法

总结

相关阅读

2. 使用 `assign` 方法

3. 使用 `insert` 方法

5. 使用 `apply` 方法

6. 使用 `concat` 方法

7. 使用 `merge` 方法