Python的concat与merge函数怎么使用

发布时间：2022-05-27 13:35:54 作者：iii
来源：亿速云阅读：327

Python的concat与merge函数怎么使用

在Python中，pandas库提供了强大的数据处理功能，其中concat和merge是两个常用的函数，用于数据框（DataFrame）的合并操作。本文将详细介绍这两个函数的使用方法。

1. `concat`函数

concat函数用于沿指定轴将多个数据框连接在一起。它可以沿行（axis=0）或列（axis=1）进行连接。

1.1 基本用法

import pandas as pd

# 创建两个数据框
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2'],
                    'B': ['B0', 'B1', 'B2']})

df2 = pd.DataFrame({'A': ['A3', 'A4', 'A5'],
                    'B': ['B3', 'B4', 'B5']})

# 沿行连接
result = pd.concat([df1, df2], axis=0)
print(result)

输出结果：

    A   B
0  A0  B0
1  A1  B1
2  A2  B2
0  A3  B3
1  A4  B4
2  A5  B5

1.2 沿列连接

# 沿列连接
result = pd.concat([df1, df2], axis=1)
print(result)

输出结果：

     A    B    A    B
0   A0   B0   A3   B3
1   A1   B1   A4   B4
2   A2   B2   A5   B5

1.3 处理索引

默认情况下，concat会保留原始索引。可以通过设置ignore_index=True来重置索引。

# 重置索引
result = pd.concat([df1, df2], ignore_index=True)
print(result)

输出结果：

    A   B
0  A0  B0
1  A1  B1
2  A2  B2
3  A3  B3
4  A4  B4
5  A5  B5

2. `merge`函数

merge函数用于根据一个或多个键将两个数据框进行合并。它类似于SQL中的JOIN操作。

2.1 基本用法

# 创建两个数据框
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2'],
                    'A': ['A0', 'A1', 'A2'],
                    'B': ['B0', 'B1', 'B2']})

df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2'],
                    'C': ['C0', 'C1', 'C2'],
                    'D': ['D0', 'D1', 'D2']})

# 根据key列进行合并
result = pd.merge(df1, df2, on='key')
print(result)

输出结果：

  key   A   B   C   D
0  K0  A0  B0  C0  D0
1  K1  A1  B1  C1  D1
2  K2  A2  B2  C2  D2

2.2 不同类型的合并

merge函数支持多种合并方式，包括内连接（inner）、左连接（left）、右连接（right）和外连接（outer）。

# 左连接
result = pd.merge(df1, df2, on='key', how='left')
print(result)

# 右连接
result = pd.merge(df1, df2, on='key', how='right')
print(result)

# 外连接
result = pd.merge(df1, df2, on='key', how='outer')
print(result)

2.3 多键合并

如果合并键不止一个，可以传递一个列表给on参数。

# 创建两个数据框
df1 = pd.DataFrame({'key1': ['K0', 'K0', 'K1'],
                    'key2': ['K0', 'K1', 'K0'],
                    'A': ['A0', 'A1', 'A2'],
                    'B': ['B0', 'B1', 'B2']})

df2 = pd.DataFrame({'key1': ['K0', 'K1', 'K1'],
                    'key2': ['K0', 'K0', 'K0'],
                    'C': ['C0', 'C1', 'C2'],
                    'D': ['D0', 'D1', 'D2']})

# 根据key1和key2列进行合并
result = pd.merge(df1, df2, on=['key1', 'key2'])
print(result)

输出结果：

  key1 key2   A   B   C   D
0   K0   K0  A0  B0  C0  D0
1   K1   K0  A2  B2  C1  D1

3. 总结

concat函数用于沿指定轴连接多个数据框，适用于简单的行或列连接。
merge函数用于根据一个或多个键将两个数据框进行合并，支持多种合并方式，适用于复杂的合并操作。

通过灵活使用concat和merge函数，可以高效地处理和分析数据。

Python的concat与merge函数怎么使用

Python的concat与merge函数怎么使用

1. concat函数

1.1 基本用法

1.2 沿列连接

1.3 处理索引

2. merge函数

2.1 基本用法

2.2 不同类型的合并

2.3 多键合并

3. 总结

相关阅读

1. `concat`函数

2. `merge`函数