Python 中如何批量合并 Excel

发布时间：2021-07-05 15:42:58 作者：Leah
来源：亿速云阅读：362

Python 中如何批量合并 Excel

在日常工作中，我们经常需要处理多个 Excel 文件，并将它们合并成一个文件以便于分析或报告。手动操作不仅耗时，还容易出错。Python 提供了强大的库来处理 Excel 文件，使得批量合并 Excel 文件变得非常简单。本文将介绍如何使用 Python 中的 pandas 和 openpyxl 库来批量合并 Excel 文件。

1. 安装必要的库

首先，我们需要安装 pandas 和 openpyxl 库。pandas 是一个强大的数据处理库，而 openpyxl 则用于处理 Excel 文件。你可以使用以下命令来安装这两个库：

pip install pandas openpyxl

2. 导入库

在开始编写代码之前，我们需要导入所需的库：

import pandas as pd
import os

3. 获取所有 Excel 文件

假设我们有一个文件夹，里面存放了多个需要合并的 Excel 文件。我们可以使用 os 模块来获取该文件夹中的所有 Excel 文件：

folder_path = 'path/to/your/excel/files'
excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]

4. 读取并合并 Excel 文件

接下来，我们可以使用 pandas 来读取每个 Excel 文件，并将它们合并成一个 DataFrame。假设每个 Excel 文件的结构相同，我们可以使用以下代码：

all_data = pd.DataFrame()

for file in excel_files:
    file_path = os.path.join(folder_path, file)
    df = pd.read_excel(file_path)
    all_data = pd.concat([all_data, df], ignore_index=True)

在这个代码片段中，我们首先创建了一个空的 DataFrame all_data。然后，我们遍历每个 Excel 文件，使用 pd.read_excel() 读取文件内容，并将其追加到 all_data 中。ignore_index=True 参数确保合并后的 DataFrame 有一个连续的索引。

5. 保存合并后的 Excel 文件

最后，我们可以将合并后的 DataFrame 保存为一个新的 Excel 文件：

output_file = 'merged_excel.xlsx'
all_data.to_excel(output_file, index=False)

index=False 参数确保在保存文件时不会将 DataFrame 的索引写入 Excel 文件中。

6. 完整代码示例

以下是完整的代码示例：

import pandas as pd
import os

# 定义文件夹路径
folder_path = 'path/to/your/excel/files'

# 获取所有 Excel 文件
excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 创建一个空的 DataFrame
all_data = pd.DataFrame()

# 读取并合并所有 Excel 文件
for file in excel_files:
    file_path = os.path.join(folder_path, file)
    df = pd.read_excel(file_path)
    all_data = pd.concat([all_data, df], ignore_index=True)

# 保存合并后的 Excel 文件
output_file = 'merged_excel.xlsx'
all_data.to_excel(output_file, index=False)

print(f"合并完成，文件已保存为 {output_file}")

7. 注意事项

文件结构一致性：确保所有 Excel 文件的结构（列名、数据类型等）一致，否则合并时可能会出现错误。
内存管理：如果处理的 Excel 文件非常大，可能会导致内存不足。在这种情况下，可以考虑分批次读取和合并文件。
文件格式：本文示例假设 Excel 文件为 .xlsx 格式。如果文件格式不同（如 .xls），需要调整读取方式。

8. 总结

通过使用 Python 的 pandas 和 openpyxl 库，我们可以轻松地批量合并多个 Excel 文件。这种方法不仅高效，而且可以避免手动操作中的错误。希望本文能帮助你更好地处理 Excel 文件，提高工作效率。

如果你有更多关于 Python 数据处理的需求，欢迎继续探索 pandas 库的其他功能，它提供了丰富的工具来处理和分析数据。

Python 中如何批量合并 Excel

Python 中如何批量合并 Excel

1. 安装必要的库

2. 导入库

3. 获取所有 Excel 文件

4. 读取并合并 Excel 文件

5. 保存合并后的 Excel 文件

6. 完整代码示例

7. 注意事项

8. 总结

相关阅读