重要的Python库有哪些

发布时间:2021-10-19 16:21:54 作者:iii
来源:亿速云 阅读:115

这篇文章主要讲解了“重要的Python库有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“重要的Python库有哪些”吧!

01 NumPy

http://numpy.org

重要的Python库有哪些

NumPy是Numerical Python的简写,是Python数值计算的基石。它提供多种数据结构、算法以及大部分涉及Python数值计算所需的接口。NumPy还包括其他内容:

成熟的C语言API,允许Python拓展和本地的C或C++代码访问NumPy的数据结构和计算设施。

除了NumPy赋予Python的快速数组处理能力之外,NumPy的另一个主要用途是在算法和库之间作为数据传递的数据容器。对于数值数据,NumPy数组能够比Python内建数据结构更为高效地存储和操作数据。

此外,用底层语言编写的库,例如用C或Fortran编写的库,可以在NumPy数组存储的数据上直接操作,而无须将数据复制到其他内存中后再操作。因此,许多Python的数值计算工具将NumPy数组作为基础数据结构,或与NumPy进行无缝互操作。

02 pandas

http://pandas.pydata.org

重要的Python库有哪些

pandas提供了高级数据结构和函数,这些数据结构和函数的设计使得利用结构化、表格化数据的工作快速、简单、有表现力。它出现于2010年,帮助Python成为强大、高效的数据分析环境。常用的pandas对象是DataFrame,它是用于实现表格化、面向列、使用行列标签的数据结构;以及Series,一种一维标签数组对象。

pandas将表格和关系型数据库(例如SQL)的灵活数据操作能力与NumPy的高性能数组计算的理念相结合。它提供复杂的索引函数,使得数据的重组、切块、切片、聚合、子集选择更为简单。由于数据操作、预处理、清洗在数据分析中是重要的技能,pandas将是重要主题。

介绍一点背景知识,早在2008年,我在一家量化投资企业——AQR资本管理公司供职时,便开始了pandas的开发。那时候,我有一些独特的需求是工具清单上任何单个工具无法满足的:

我想将以上的工作在同一个地方完成,最好还能在一个拥有通用软件开发能力的语言中实现。Python就是一个很好的备选项,但是那时候并没有这类数据结构的整合集,也没有能提供相关功能的工具。结果就是pandas最初被开发出来用于解决金融和商业分析问题,pandas尤其擅长深度时间序列和处理商业进程中产生的时间索引数据。

使用R语言进行统计计算的用户对DataFrame的名称会非常熟悉,因为这个对象是根据相似的R data.frame对象进行命名的。与Python不同的是,数据框在R语言中是标准库中的内容。因此,pandas中的很多特征通常与R核心的实现或者R的附加库提供的功能一致。

pandas的名字的来源是panel data,这是计量经济学中针对多维结构化数据集的术语。pandas也是Python data analysis(Python数据分析)自身的简写短语。

03 matplotlib

http://matplotlib.org

重要的Python库有哪些

matplotlib是很流行的用于制图及其他二维数据可视化的Python库。它由John D. Hunter创建,目前由一个大型开发者团队维护。matplotlib被设计为适合出版的制图工具。

对于Python编程者来说也有其他可视化库,但matplotlib依然使用最为广泛,并且与生态系统的其他库良好整合。我认为将它作为默认可视化工具是一个安全的选择。

关于matplotlib更详细讲解,请戳:纯干货:手把手教你用Python做数据可视化(附代码)

04 IPython与Jupyter

http://ipython.org

http://jupyter.org

重要的Python库有哪些

IPython项目开始于2001年,由Fernando Pérez发起,旨在开发一个更具交互性的Python解释器。在过去的16年中,它成为Python数据技术栈中最重要的工具之一。

尽管它本身并不提供任何计算或数据分析工具,它的设计侧重于在交互计算和软件开发两方面将生产力最大化。它使用了一种执行-探索工作流来替代其他语言中典型的编辑-编译-运行工作流。它还提供针对操作系统命令行和文件系统的易用接口。由于数据分析编码工作包含大量的探索、试验、试错和遍历,IPython可以使你更快速地完成工作。

2014年,Fernando和IPython团队发布了Jupyter项目。Jupyter项目旨在设计一个适用于更多语言的交互式计算工具。IPython web notebook 则成为Jupyter notebook,可以支持超过40种编程语言。IPython系统目前可以作为一个内核(一种编程语言模式)用于在 Jupyter 中使用Python。

IPython自身已成为 Jupyter开源项目中的一个组件,后者提供交互性、探索性的高效环境。IPtyhon最古老、最简单的“模式”就是一个加强版的Python命令行,用于提高编写、测试、调试Python代码的速度。

你也可以通过基于Web、支持多语言的代码“笔记本”——Jupyter Notebook来使用IPython系统。IPython命令行和 Jupyter notebook对于数据探索和可视化非常有用。

Jupyter notebook系统允许你使用Markdown和HTML创建包含代码和文本的富文档。其他编程语言也针对Jupyter实现了内核,允许你在Jupyter中使用多种语言而不仅仅是Python。

对我个人来说,IPython涉及我工作的大部分内容,包括运行、调试、测试代码。

05 SciPy

http://scipy.org

重要的Python库有哪些

SciPy是科学计算领域针对不同标准问题域的包集合。以下是SciPy中包含的一些包:

SciPy与NumPy一起为很多传统科学计算应用提供了一个合理、完整、成熟的计算基础。

06 scikit-learn

http://scikit-learn.org

重要的Python库有哪些

scikit-learn项目诞生于2010年,目前已成为Python编程者首选的机器学习工具包。仅仅七年,scikit-learn就拥有了全世界1 500位代码贡献者。其中包含以下子模块。

scikit-learn与pandas、statsmodels、IPython一起使Python成了高效的数据科学编程语言。

07 statsmodels

http://statsmodels.org

重要的Python库有哪些

statsmodels是一个统计分析包。它源自斯坦福大学统计学教授Jonathan Taylor 利用R语言实现的各类分析模型。Skipper Seabold 和 Josef Perktold早在2010年便创建了新的statsmodels项目。自那之后该项目迅速成长,拥有大量活跃用户和贡献者者。

Nathaniel Smith 开发了Patsy项目,为R语言公式系统所驱动的statsmodels包提供公式、模型规范框架。

与scikit-learn相比,statsmodels包含经典的(高频词汇)统计学、经济学算法。它所包含的模型如下。

statsmodels更专注于统计推理,提供不确定性评价和p值参数。相反,scikit-learn更专注于预测。

感谢各位的阅读,以上就是“重要的Python库有哪些”的内容了,经过本文的学习后,相信大家对重要的Python库有哪些这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!

推荐阅读:
  1. Python库有哪些
  2. 有用的Python库有哪些

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

python

上一篇:有哪些速度很慢的动态编程语言

下一篇:k8s部署步骤是什么

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》