Python中怎么使用 pivot_table()实现数据透视功能

发布时间：2021-07-05 16:04:03 作者：Leah
来源：亿速云阅读：440

Python中怎么使用 pivot_table()实现数据透视功能

在数据分析和处理过程中，数据透视表（Pivot Table）是一种非常强大的工具，它可以帮助我们快速地对数据进行汇总、分析和展示。Python中的pandas库提供了pivot_table()函数，可以方便地实现数据透视功能。本文将详细介绍如何使用pivot_table()函数来实现数据透视功能。

1. 什么是数据透视表？

数据透视表是一种交互式的表格，可以对大量数据进行快速汇总和分析。它允许用户通过拖放字段来重新排列和汇总数据，从而生成不同的视图。数据透视表通常用于数据分析、报表生成和数据可视化等场景。

2. `pivot_table()`函数的基本用法

pandas库中的pivot_table()函数用于创建数据透视表。它的基本语法如下：

pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')

参数说明：

data: 要处理的数据框（DataFrame）。
values: 需要聚合的列名或列名列表。
index: 用于分组的列名或列名列表，这些列将作为透视表的行索引。
columns: 用于分组的列名或列名列表，这些列将作为透视表的列索引。
aggfunc: 聚合函数，默认为'mean'，可以是'sum'、'count'、'min'、'max'等，也可以是自定义函数。
fill_value: 用于替换缺失值的值。
margins: 是否添加总计行/列，默认为False。
dropna: 是否删除包含缺失值的行/列，默认为True。
margins_name: 总计行/列的名称，默认为'All'。

3. 使用`pivot_table()`实现数据透视功能

3.1 创建示例数据

首先，我们创建一个示例数据框来演示如何使用pivot_table()函数。

import pandas as pd

data = {
    'Date': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02', '2023-01-03', '2023-01-03'],
    'City': ['New York', 'Los Angeles', 'New York', 'Los Angeles', 'New York', 'Los Angeles'],
    'Temperature': [32, 75, 30, 77, 28, 80],
    'Humidity': [80, 50, 85, 45, 90, 40]
}

df = pd.DataFrame(data)
print(df)

输出结果：

         Date         City  Temperature  Humidity
0  2023-01-01     New York           32        80
1  2023-01-01  Los Angeles           75        50
2  2023-01-02     New York           30        85
3  2023-01-02  Los Angeles           77        45
4  2023-01-03     New York           28        90
5  2023-01-03  Los Angeles           80        40

3.2 基本数据透视表

假设我们想要按城市和日期对温度进行汇总，可以使用以下代码：

pivot = pd.pivot_table(df, values='Temperature', index='Date', columns='City', aggfunc='mean')
print(pivot)

输出结果：

City        Los Angeles  New York
Date                              
2023-01-01           75        32
2023-01-02           77        30
2023-01-03           80        28

在这个例子中，values='Temperature'表示我们要对温度进行汇总，index='Date'表示按日期分组，columns='City'表示按城市分组，aggfunc='mean'表示使用平均值进行聚合。

3.3 多列聚合

如果我们想要同时对温度和湿度进行汇总，可以将values参数设置为一个列表：

pivot = pd.pivot_table(df, values=['Temperature', 'Humidity'], index='Date', columns='City', aggfunc='mean')
print(pivot)

输出结果：

           Humidity              Temperature          
City        Los Angeles New York Los Angeles New York
Date                                                 
2023-01-01          50       80          75       32
2023-01-02          45       85          77       30
2023-01-03          40       90          80       28

3.4 使用不同的聚合函数

aggfunc参数可以接受多个聚合函数。例如，我们可以同时计算温度和湿度的平均值和最大值：

pivot = pd.pivot_table(df, values=['Temperature', 'Humidity'], index='Date', columns='City', aggfunc=['mean', 'max'])
print(pivot)

输出结果：

                mean                          max                    
           Humidity              Temperature Humidity      Temperature
City        Los Angeles New York Los Angeles New York Los Angeles New York
Date                                                                     
2023-01-01          50       80          75       32          50       80
2023-01-02          45       85          77       30          45       85
2023-01-03          40       90          80       28          40       90

3.5 添加总计行/列

如果我们想要在透视表中添加总计行和总计列，可以将margins参数设置为True：

pivot = pd.pivot_table(df, values='Temperature', index='Date', columns='City', aggfunc='mean', margins=True)
print(pivot)

输出结果：

City        Los Angeles  New York   All
Date                                   
2023-01-01           75        32  53.5
2023-01-02           77        30  53.5
2023-01-03           80        28  54.0
All                  77        30  53.666667

3.6 处理缺失值

如果数据中存在缺失值，可以使用fill_value参数来指定一个值来填充缺失值：

pivot = pd.pivot_table(df, values='Temperature', index='Date', columns='City', aggfunc='mean', fill_value=0)
print(pivot)

4. 总结

pandas库中的pivot_table()函数是一个非常强大的工具，可以帮助我们快速地对数据进行汇总和分析。通过灵活地使用index、columns、values和aggfunc等参数，我们可以轻松地生成各种复杂的数据透视表。希望本文的介绍能够帮助你更好地理解和使用pivot_table()函数。

Python中怎么使用 pivot_table()实现数据透视功能

Python中怎么使用 pivot_table()实现数据透视功能

1. 什么是数据透视表？

2. pivot_table()函数的基本用法

参数说明：

3. 使用pivot_table()实现数据透视功能

3.1 创建示例数据

3.2 基本数据透视表

3.3 多列聚合

3.4 使用不同的聚合函数

3.5 添加总计行/列

3.6 处理缺失值

4. 总结

相关阅读

2. `pivot_table()`函数的基本用法

3. 使用`pivot_table()`实现数据透视功能