为什么是Numpy?

一起学习,一起成长!

Numpy(Numerical 的简称)是高性能科学计算和数据分析的基础包。

  • ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。
  • 用于对整组进行快速运算的标准数学函数(无需编写循环)。
  • 用于读写磁盘数据的工具以及用于操作映射文件的工具。
  • 线性代数、随机数生成以及傅里叶变换功能。
  • 用于集成由C、C++、Fortran等语言编写的代码的工具。

数据分析主要关注的功能:

  • 用于数据整理和清理、子集构造和过滤、转换等快速的矢量化数组运算。
  • 常用的数组算法,如排序、唯一化、集合运算等等。
  • 高效的描述统计和数据聚合/摘要运算。
  • 用于异构数据集的合并/连接运算的数据对齐和关系型数据运算。
  • 将条件逻辑表达为数组表达式(而不是带有if-elif-else分支的循环)。
  • 数据的分组运算(聚合、转换、函数应用等)。

Numpy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。可以利用这种数组对整块数据执行一些数学运算。

import numpy as np

data=np.array(data) #可以进行加减乘除等运算

data

Out[5]:

array([[ 0.9526, -0.246 , -0.8856],

[ 0.5639, 0.2379, 0.9104]])

ndarray是一个通用的同构数据多维容器,也就是说,其中的所有元素必须是相同类型的。每个数组都有一个shape(一个表示各维度大小的元组)和一个dtype(一个用于说明数组数据类型的对象)。

#查看元组各维度大小

In[9]:data.shape

Out[9]: (2, 3)

#查看数组数据类型的对象

In[10]:data.dtype

Out[10]: dtype('float64')

胜象大百科