Python中numpy优势是什么

发布时间：2020-06-29 13:35:59 作者：清晨
来源：亿速云阅读：1954

这篇文章将为大家详细讲解有关Python中numpy优势是什么，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

1.Numpy的优势

Python已经提供了很多丰富的内置包，我们为什么还要学习NumPy呢？先看一个例子，找寻学习 NumPy 的必要性和重要性。如下：

Python中numpy优势是什么

完成同样的都对元素相加的操作，NumPy比Python快了11倍之多。这就是我们要学好NumPy的一个重要理由，它在处理更大数据量时，处理效率明显快于Python。并且内置的向量化运算和广播机制，使得使用NumPy更加简洁，会少写很多嵌套的for循环，因此代码的可读性大大增强。NumPy计算为什么这么快呢？原因如下：

1）Python 的 list是一个通用结构。它能包括任意类型的对象，并且是动态类型。

2）NumPy 的 ndarray 是静态、同质的类型，当ndarray对象被创建时，元素的类型就确定。由于是静态类型，所以ndarray间的加、减、乘、除用 C 和 Fortran 实现才成为可能，所以运行起来就会更快。根据官方介绍，底层代码用 C语言和 Fortran 语言实现，实现性能无限接近 C 的处理效率。

3）支持并行化运算，也叫向量化运算。当然向量是数学当中的概念，我们不过多解释，只需要知道他的优势即可。也就是说 NumPy 底层使用 BLAS 做向量，矩阵运算。

numpy的许多函数不仅是用C实现了，还使用了BLAS(一般Windows下link到MKL的，下link到OpenBLAS)

基本上那些BLAS实现在每种操作上都进行了高度优化

例如使用AVX向量指令集，甚至能比你自己用C实现快上许多，更不要说和用Python实现的比

由此可见，NumPy 就非常适合做大规模的数值计算和数据分析。

2. 数组属性

数组属性反映了数组本身固有的信息。

属性名字属性解释

ndarray.shape 数组维度的元组

ndarray.flags 有关阵列内存布局的信息

ndarray.ndim 数组维数

ndarray.size 数组中的元素数量

ndarray.itemsize 一个数组元素的长度(字节)

ndarray.nbytes 数组元素消耗的总字节数

示例代码如下：

import numpy as np
# 数组的属性
# 1.创建数组 这里先不用管 后续会详细讲解数组的创建方法
a = np.array([[1,2,3],[4,5,6]])
b = np.array([1,2,3,4])
c = np.array([[[1,2,3],[4,5,6]],[[1,2,3],[4,5,6]]])
# 创建数组的时候指定类型
# dtype更多取值: int complex bool object
# 还可以显示的定义数据位数的类型，如: int64、int16、float128、complex128。
d = np.array([1,2,3,4], dtype=np.float)
# 2.测试数组属性
print(a.shape)  # 数组形状  (2, 3): 二维数组
print(b.shape)  # (4,) 一维数组: 有4个元素
print(c.shape)  # (2, 2, 3): 三维数组
print(a.ndim)  # 数组维数 2
print(a.size)  # 元素的数量 6 
print(a.itemsize)  # 每一个元素占的位数(字节) 8
print(a.nbytes)  # 总共占的字节数 6*8 ==> 48
print(a.flags)  # 阵列内存布局
print(a.dtype)  # 数组类型 int64
print(d.dtype)  # float64

上述代码执行结果如下：

Python中numpy优势是什么

3. 创建数组

1）创建0和1的数组示例代码如下：

Python中numpy优势是什么

2）从现有的数据中创建示例代码如下：

num_list = [[1,2,3], [4,5,6]]
a = np.array(num_list)
a1 = np.array(a)  # 创建了一个新的数组
a2 = np.asarray(a)  # 还是引用原来的数组
print(a)
print(a1)
print(a2)
a[0] = 10
a, a1, a2

上述代码执行结果如下：

Python中numpy优势是什么

3）创建固定范围的数组，语法格式如下：

np.linspace(start, stop, num, endpoint, retstep, dtype) 生成等间隔的序列
start：序列的起始值
stop：序列的终止值
num：要生成的等间隔样例数量，默认为50
endpoint：序列中是否包含stop值，默认为True
retstep：如果为True，返回样例，以及连续数字之间的步长
dtype：输出ndarray的数据类型

示例代码如下：