Python中Pandas数据合并方法有哪些

发布时间:2021-11-26 10:26:47 作者:iii
来源:亿速云 阅读:640

这篇文章主要介绍“Python中Pandas数据合并方法有哪些”,在日常操作中,相信很多人在Python中Pandas数据合并方法有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中Pandas数据合并方法有哪些”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

1.concat()

concat() 可用于两个及多个 DataFrame 间行/列方向进行内联或外联拼接操作,默认对行(沿 y 轴)取并集。

使用方式

pd.concat(
    objs: Union[Iterable[~FrameOrSeries], Mapping[Union[Hashable, NoneType], ~FrameOrSeries]],
    axis=0,
    join='outer',
    ignore_index: bool = False,
    keys=None,
    levels=None,
    names=None,
    verify_integrity: bool = False,
    sort: bool = False,
    copy: bool = True,
)

主要参数

示例

创建两个 DataFrame

df1 = pd.DataFrame(
          {'char': ['a', 'b'],
           'num': [1, 2]})
df2 = pd.DataFrame(
          {'char': ['b', 'c'],
           'num': [3, 4]})

Python中Pandas数据合并方法有哪些

concat() 默认会对行方向进行拼接操作,连接方式 outer

pd.concat([d1, d2])

Python中Pandas数据合并方法有哪些

清除现有索引并重置索引。

pd.concat(
    [d1, d2],
    ignore_index=True)

Python中Pandas数据合并方法有哪些

通过 keys 参数在数据的最外层添加分层索引。

pd.concat(
    [d1, d2],
    keys=['d1', 'd2'])

Python中Pandas数据合并方法有哪些

指定 names 参数来标记创建的索引键。

pd.concat(
    [d1, d1],
    keys=['d1', 'd2'],
    names=['DF Name', 'Row ID'])

Python中Pandas数据合并方法有哪些

将两个 DataFrame 与重叠的列进行组合并返回所有内容。 交集外的列填充 NaN

df3 = pd.DataFrame(
          {'char': ['b', 'c'],
          'float': [3.0, 4.0]})
pd.concat([df1, df3])

Python中Pandas数据合并方法有哪些

将两个 DataFrame 与重叠的列进行组合,只返回重叠列的内容。

pd.concat(
    [df1, df3],
    join="inner")

Python中Pandas数据合并方法有哪些

指定 axis=1 沿 x 轴水平组合 DataFrame 对象。

df4 = pd.DataFrame(
          {'char': ['b', 'c', 'd'],
           'num': [3, 4, 5]},
           index=range(1, 4))
pd.concat([df1, df4], axis=1)

Python中Pandas数据合并方法有哪些

2.merge()

merge() 只能用于两个 DataFrame 间列方向进行内联或外联合并操作,默认列合并(沿 x 轴),取交集(即:以两个 DataFrame 列名的交集作为连接键)

使用方式

pd.merge(
    left,
    right,
    how: str = 'inner',
    on=None,
    left_on=None,
    right_on=None,
    left_index: bool = False,
    right_index: bool = False,
    sort: bool = False,
    suffixes=('_x', '_y'),
    copy: bool = True,
    indicator: bool = False,
    validate=None,
)

参数

示例

创建两个DataFrame

df1 = pd.DataFrame(
          {'name': ['A1', 'B1', 'C1'],
           'grade': [60, 70, 80]})
df2 = pd.DataFrame(
          {'name': ['B1', 'C1', 'D1'],
           'grade': [70, 80, 100]})

Python中Pandas数据合并方法有哪些

merge() 默认情况下,会根据两个 DataFrame 中同时存在的列进行合并,合并方法采用取交集的方式。

df1.merge(df2)

Python中Pandas数据合并方法有哪些

指定合并的方式为 outer,取并集。

df1.merge(df2, how='outer')

Python中Pandas数据合并方法有哪些

下面再创建两个 DataFrame

df1 = pd.DataFrame(
      {'name1': ['A1', 'B1', 'B1', 'C1'],
       'grade': [60, 70, 80, 90]})
df2 = pd.DataFrame(
      {'name2': ['B1', 'C1', 'D1', 'E1'],
       'grade': [70, 80, 90, 100]})

Python中Pandas数据合并方法有哪些

根据 name1name2 列合并 df1df2grade 列附加了默认后缀 _x_y

df1.merge(
    df2,
    left_on='name1',
    right_on='name2')

Python中Pandas数据合并方法有哪些

合并 df1df2,并将指定的左右后缀附加到重叠列末尾。

df1.merge(
    df2,
    left_on='name1',
    right_on='name2',
    suffixes=('_1', '_2'))

Python中Pandas数据合并方法有哪些

3.append()

append() 可用于两个及多个 DataFrame 间行方向(沿 y 轴)的拼接操作,默认取并集。

使用方式

df1.append(
    other,
    ignore_index=False,
    verify_integrity=False,
    sort=False)

参数

示例

创建两个 DataFrame

df1 = pd.DataFrame(
          [[1, 2], [3, 4]],
          columns=list('AB'))
df2 = pd.DataFrame(
          [[5, 6], [7, 8]],
          columns=list('BC'))

Python中Pandas数据合并方法有哪些

append() 在默认情况下会沿y轴垂直拼接两个 DataFramedf1df2 交集外的列填充 NaN

df1.append(df2)

Python中Pandas数据合并方法有哪些

ignore_index 设置为 True,来达到重置轴的索引。

df1.append(df2, ignore_index=True)

Python中Pandas数据合并方法有哪些

4.join()

join() 用于两个及多个 DataFrame 间列方向(沿 x 轴)的拼接操作,默认左拼接。

使用方式

df1.join(
    other,
    on=None,
    how='left',
    lsuffix='',
    rsuffix='',
    sort=False)

示例

创建两个 DataFrame

df1 = pd.DataFrame(
          {'A': ['A0', 'A1', 'A2', 'A3', 'A4'],
          'val': ['V0', 'V1', 'V2', 'V3', 'V4']})
df2 = pd.DataFrame(
          {'B': ['B3', 'B4', 'B5'],
          'val': ['V3', 'V4', 'V5']})

Python中Pandas数据合并方法有哪些

如果我们想使用 val 列进行连接,我们需要将 val 设置为 df1df2 中的索引。

df1.set_index('val').join(
    df2.set_index('val'))

Python中Pandas数据合并方法有哪些

使用 val 列连接的另一个方法是指定 on 参数。 df1.join 只能使用 df2 的索引,但可以使用 df1 中的任何列。所以可以只将 df2 中的 val 列转为索引,并通过 on 参数指定 df1 的连接列为 val

df1.join(
    df2.set_index('val'),
    on='val')

Python中Pandas数据合并方法有哪些

使用外连接的方式连接 df1df2

df1.join(
    df2.set_index('val'),
    on='val',
    how='outer')

Python中Pandas数据合并方法有哪些

到此,关于“Python中Pandas数据合并方法有哪些”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!

推荐阅读:
  1. PANDAS中如何实现数据合并与重塑
  2. 在Pandas中如何实现DataFrame数据合并

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python pandas

上一篇:C/C++ QT实现自定义对话框的方法是什么

下一篇:C#如何实现基于Socket套接字的网络通信封装

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》