如何使用Pandas读取不同格式文件

发布时间:2025-11-14 00:57:56 作者:小樊
来源:亿速云 阅读:84

Pandas 是一个强大的 Python 数据分析库,它可以轻松地读取和操作各种数据格式。以下是使用 Pandas 读取不同格式文件的方法:

  1. 读取 CSV 文件:
import pandas as pd

df = pd.read_csv('file.csv')
  1. 读取 Excel 文件:
import pandas as pd

df = pd.read_excel('file.xlsx', sheet_name='Sheet1')

如果有多个工作表,可以通过 sheet_name 参数指定要读取的工作表名称或索引。

  1. 读取 JSON 文件:
import pandas as pd

df = pd.read_json('file.json')
  1. 读取 HTML 表格:
import pandas as pd

df = pd.read_html('file.html')

read_html 函数会返回一个包含所有表格的列表。你可以通过索引访问特定的表格。

  1. 读取文本文件(如制表符分隔值):
import pandas as pd

df = pd.read_csv('file.txt', delimiter='\t')

delimiter 参数用于指定分隔符,例如制表符(\t)、逗号(,)等。

  1. 读取固定宽度文件:
import pandas as pd

df = pd.read_fwf('file.txt', widths=[10, 20, 30])

widths 参数是一个整数列表,表示每个字段的宽度。

  1. 读取 Parquet 文件:
import pandas as pd

df = pd.read_parquet('file.parquet')
  1. 读取 Feather 文件:
import pandas as pd

df = pd.read_feather('file.feather')
  1. 读取 ORC 文件:
import pandas as pd

df = pd.read_orc('file.orc')

在读取文件时,Pandas 还提供了许多其他参数,以便根据需要自定义数据导入过程。例如,你可以使用 header 参数指定表头所在的行,使用 names 参数为列提供自定义名称等。更多信息,请查阅 Pandas 文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

推荐阅读:
  1. Python实现连接及保存激活码到mysql和redis
  2. MySQLdb查询有中文关键字查不到数据

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python

上一篇:Ansible与云服务如何结合使用

下一篇:DRP计划实施中常见误区有哪些

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》