如何用Pandas合并多个数据集

发布时间:2025-09-11 11:58:06 作者:小樊
来源:亿速云 阅读:93

使用Pandas合并多个数据集通常涉及以下几种方法:

  1. concat():用于沿着一条轴将多个对象堆叠到一起。
  2. merge():用于根据一个或多个键将不同的DataFrame的行连接起来。
  3. join():基于索引或列标签将两个DataFrame连接起来。

下面是一些示例:

使用 concat()

假设我们有两个数据集 df1df2,我们可以沿着行轴(axis=0)或列轴(axis=1)将它们合并。

import pandas as pd

# 创建示例数据集
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})

# 沿着行轴合并
result = pd.concat([df1, df2], axis=0)
print(result)

# 沿着列轴合并
result = pd.concat([df1, df2], axis=1)
print(result)

使用 merge()

假设我们有两个数据集 df1df2,它们有一个共同的列 key,我们可以根据这个键将它们合并。

import pandas as pd

# 创建示例数据集
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                    'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K4'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']})

# 根据 'key' 列合并
result = pd.merge(df1, df2, on='key')
print(result)

使用 join()

假设我们有两个数据集 df1df2,它们有一个共同的索引,我们可以基于这个索引将它们合并。

import pandas as pd

# 创建示例数据集
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']}, index=['K0', 'K1'])
df2 = pd.DataFrame({'C': ['C0', 'C1'], 'D': ['D0', 'D1']}, index=['K0', 'K1'])

# 基于索引合并
result = df1.join(df2)
print(result)

合并多个数据集

如果你有多个数据集需要合并,可以多次调用 concat()merge() 方法。例如:

import pandas as pd

# 创建示例数据集
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
df3 = pd.DataFrame({'A': ['A4', 'A5'], 'B': ['B4', 'B5']})

# 合并多个数据集
result = pd.concat([df1, df2, df3], axis=0)
print(result)

通过这些方法,你可以灵活地合并多个数据集。根据具体的需求选择合适的方法,并注意处理可能的重复键或索引问题。

推荐阅读:
  1. 详解Python中socket网络通信
  2. Python中使用SQLite的方法

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python

上一篇:Ansible与云服务如何结合使用

下一篇:Pandas中如何进行数据筛选

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》