Pandas

pandas根据列去重的方法是什么

小亿
125
2024-01-27 22:03:20
栏目: 编程语言

pandas根据列去重的方法是使用drop_duplicates()函数。该函数能够返回一个新的DataFrame,其中的重复值已经被删除。

具体用法如下:

df.drop_duplicates(subset=[列名], keep='first', inplace=True)

示例:

import pandas as pd

# 创建一个包含重复值的DataFrame
data = {'A': [1, 2, 2, 3, 4, 4],
        'B': ['a', 'b', 'b', 'c', 'd', 'd']}
df = pd.DataFrame(data)

# 根据列'A'去重
df.drop_duplicates(subset=['A'], keep='first', inplace=True)
print(df)

输出结果:

   A  B
0  1  a
1  2  b
3  3  c
4  4  d

在上述示例中,根据列’A’去重后,保留了第一个出现的重复值。

0
看了该问题的人还看了