python DataFrame中stack()方法、unstack()方法和pivot()方法怎么用

发布时间：2022-04-06 11:07:26 作者：iii
来源：亿速云阅读：460

Python DataFrame中stack()方法、unstack()方法和pivot()方法怎么用

在数据分析和处理中，Pandas库是Python中最常用的工具之一。Pandas提供了强大的数据结构，如DataFrame，用于处理和分析结构化数据。在DataFrame中，stack()、unstack()和pivot()是三个常用的方法，用于数据的重塑和透视。本文将详细介绍这三个方法的用法，并通过示例代码帮助读者理解它们的具体应用场景。

1. stack()方法

stack()方法用于将DataFrame的列“堆叠”为行，即将列索引转换为行索引。它通常用于将宽格式的数据转换为长格式的数据。

1.1 基本用法

import pandas as pd

# 创建一个示例DataFrame
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
}, index=['X', 'Y', 'Z'])

print("原始DataFrame:")
print(df)

# 使用stack()方法
stacked_df = df.stack()

print("\nstack()后的DataFrame:")
print(stacked_df)

输出结果：

原始DataFrame:
   A  B  C
X  1  4  7
Y  2  5  8
Z  3  6  9

stack()后的DataFrame:
X  A    1
   B    4
   C    7
Y  A    2
   B    5
   C    8
Z  A    3
   B    6
   C    9
dtype: int64

1.2 解释

原始DataFrame有三列（A、B、C）和三行（X、Y、Z）。
使用stack()方法后，列索引（A、B、C）被转换为行索引，形成多级索引（MultiIndex）。
结果是一个Series对象，其中每个元素由原始DataFrame的行索引和列索引组合而成。

1.3 应用场景

stack()方法通常用于将宽格式的数据转换为长格式的数据，便于后续的分析和处理。例如，在处理时间序列数据或面板数据时，stack()方法可以将多个时间点的数据堆叠在一起，形成更长的数据格式。

2. unstack()方法

unstack()方法与stack()方法相反，它将行索引“展开”为列索引，即将多级索引的行转换为列。

2.1 基本用法

# 使用unstack()方法
unstacked_df = stacked_df.unstack()

print("\nunstack()后的DataFrame:")
print(unstacked_df)

输出结果：

unstack()后的DataFrame:
   A  B  C
X  1  4  7
Y  2  5  8
Z  3  6  9

2.2 解释

unstack()方法将stack()后的Series对象重新转换为DataFrame。
原始的多级索引被展开，行索引（X、Y、Z）保持不变，列索引（A、B、C）重新出现。

2.3 应用场景

unstack()方法通常用于将长格式的数据转换为宽格式的数据，便于数据的展示和分析。例如，在处理面板数据时，unstack()方法可以将多个时间点的数据展开为多个列，形成更宽的数据格式。

3. pivot()方法

pivot()方法用于将DataFrame中的数据重新排列，生成一个新的DataFrame。它通常用于将长格式的数据转换为宽格式的数据，类似于Excel中的数据透视表。

3.1 基本用法

# 创建一个示例DataFrame
df = pd.DataFrame({
    'Date': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],
    'City': ['Beijing', 'Shanghai', 'Beijing', 'Shanghai'],
    'Temperature': [10, 15, 12, 18]
})

print("原始DataFrame:")
print(df)

# 使用pivot()方法
pivot_df = df.pivot(index='Date', columns='City', values='Temperature')

print("\npivot()后的DataFrame:")
print(pivot_df)

输出结果：

原始DataFrame:
         Date      City  Temperature
0  2023-01-01   Beijing           10
1  2023-01-01  Shanghai           15
2  2023-01-02   Beijing           12
3  2023-01-02  Shanghai           18

pivot()后的DataFrame:
City        Beijing  Shanghai
Date                         
2023-01-01       10        15
2023-01-02       12        18

3.2 解释

原始DataFrame包含三列：Date、City和Temperature。
使用pivot()方法后，Date列作为行索引，City列作为列索引，Temperature列作为值。
结果是一个新的DataFrame，其中每个单元格表示某个日期和城市的温度。

3.3 应用场景

pivot()方法通常用于将长格式的数据转换为宽格式的数据，便于数据的展示和分析。例如，在处理时间序列数据或地理数据时，pivot()方法可以将多个维度的数据重新排列，形成更直观的数据格式。

4. 总结

stack()方法用于将列索引转换为行索引，将宽格式的数据转换为长格式的数据。
unstack()方法用于将行索引转换为列索引，将长格式的数据转换为宽格式的数据。
pivot()方法用于将长格式的数据重新排列，生成一个新的DataFrame，类似于数据透视表。

在实际的数据分析和处理中，stack()、unstack()和pivot()方法是非常有用的工具，能够帮助用户灵活地重塑和透视数据，满足不同的分析需求。通过本文的介绍和示例代码，读者可以更好地理解这三个方法的用法和应用场景，并在实际工作中灵活运用。

python DataFrame中stack()方法、unstack()方法和pivot()方法怎么用

Python DataFrame中stack()方法、unstack()方法和pivot()方法怎么用

1. stack()方法

1.1 基本用法

1.2 解释

1.3 应用场景

2. unstack()方法

2.1 基本用法

2.2 解释

2.3 应用场景

3. pivot()方法

3.1 基本用法

3.2 解释

3.3 应用场景

4. 总结

相关阅读