利用 Python 进行数据分析（四）NumPy 基础：ndarray 简单介绍

一、NumPy 是什么

NumPy 是 Python 科学计算的基础包，它专为进行严格的数字处理而产生。在之前的随笔里已有更加详细的介绍，这里不再赘述。
利用 Python 进行数据分析（一）简单介绍

二、ndarray 是什么

ndarray 是一个多维的数组对象，具有矢量算术运算能力和复杂的广播能力，并具有执行速度快和节省空间的特点。

ndarray 的一个特点是同构：即其中所有元素的类型必须相同。

三、ndarray 的创建

array() 函数

最简单的方法，使用 NumPy 提供的 array() 函数直接将 Python 数组转换为 ndarray 数组，array() 接受一切序列类型的对象，例如将一个列表转换成 ndarray 数组：

zeros() 函数和 ones() 函数

这两个函数分别可以创建指定长度或形状的全0或全1的 ndarray 数组，比如：

empty() 函数

这个函数可以创建一个没有任何具体值的 ndarray 数组，例如：

需要注意一点的是，这个函数返回的值不一定是 0，可能是其他未初始化的垃圾值。

arange() 函数

这个函数是 Python 内置函数 range 的数组版，使用方法：

四、ndarray 的数据类型

在创建 ndarray 数组的时候可以指定元素的数据类型，例如：

所支持的数据类型包括整数、浮点数、复数、布尔值、字符串或是普通的 Python 对象（object）。

在创建 ndarray 数组的时候，如果显示指定类型，它会尝试推断出一个合适的数据类型。

类型转换

通过 ndarray 的 astype() 方法进行强制类型转换，浮点数转换为整数时小数部分会被舍弃：

如果某字符串类型的数组里的元素全是数字，也可以通过此方法直接转换成数值类型：

astype 会创建一份新的数组，即便是指定为同类型也依然如此。

五、ndarray 的简单使用

使用 ndarray 数组可以让我们不需要使用循环就可以对列表里的元素执行操作，语法和对标量元素的操作一样，例如：

接下来一篇随笔内容是：利用 Python 进行数据分析（五）NumPy 基础：ndarray 索引，有兴趣的朋友欢迎关注本博客，也欢迎大家添加评论进行讨论。

时间： 2024-12-12 08:42:57

利用 Python 进行数据分析（四）NumPy 基础：ndarray 简单介绍的相关文章

利用 Python 进行数据分析（七）- pandas 简单介绍（Series和DataFrame）

一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构:Series 和 DataFrame. 二.Series Series 是一个一维数组对象 ,类似于 NumPy 的一维 array.它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组. 将 Python 数组转换成 Series 对象: 将 Python 字典转换成 Serie

《利用python进行数据分析》NumPy基础：数组和矢量计算学习笔记

一.有关NumPy (一)官方解释 NumPy is the fundamental package for scientific computing with Python. It contains among other things: a powerful N-dimensional array object sophisticated (broadcasting) functions tools for integrating C/C++ and Fortran code useful

利用Python进行数据分析(6) NumPy基础: 矢量计算

矢量化指的是用数组表达式代替循环来操作数组里的每个元素. NumPy提供的通用函数(既ufunc函数)是一种对ndarray中的数据进行元素级别运算的函数. 例如,square函数计算各元素的平方,rint函数将各元素四舍五入: 还有一些函数接受2个参数,叫二元ufunc,比如add函数和maximum函数: numpy.where函数 numpy.where函数是三元表达式 x if condition else y 的矢量化版本,例如: np.where函数的第二个参数和第三个参数不是必要的

利用Python进行数据分析(14) pandas基础: 数据转换

数据转换指的是对数据的过滤.清理以及其他的转换操作. 移除重复数据 DataFrame里经常会出现重复行,DataFrame提供一个duplicated()方法检测各行是否重复,另一个drop_duplicates()方法用于丢弃重复行: duplicated()和drop_duplicates()方法默认判断全部列,如果不想这样,传入列的集合作为参数可以指定按列判断,例如: duplicated()和drop_duplicates()方法默认保留第一个出现的值,传入take_last=True

利用Python进行数据分析(15) pandas基础: 字符串操作

字符串对象方法 split()方法拆分字符串: strip()方法去掉空白符和换行符: split()结合strip()使用: "+"符号可以将多个字符串连接起来: join()方法也是连接字符串,比较它和"+"符号的区别: in关键字判断一个字符串是否包含在另一个字符串中: index()方法和find()方法判断一个子字符串的位置: index()方法和find()方法的区别是:如果不包含子字符串,index()会抛出一个异常,而find()会返回-1. c

利用Python进行数据分析(11) pandas基础: 层次化索引

层次化索引层次化索引指你能在一个数组上拥有多个索引,例如: 有点像Excel里的合并单元格对么? 根据索引选择数据子集以外层索引的方式选择数据子集: 以内层索引的方式选择数据: 多重索引Series转换为DataFrame 层次化索引在数据重塑和分组中扮演着很重要的角色,例如,上面的层次化索引数据可以转换为一个DataFrame: 对于一个DataFrame,横轴和竖轴都可以有层次化索引,例如: 重排分级顺序根据索引交换 swaplevel()函数可以将两个级别的数据进行交换,例如: 根据

利用Python进行数据分析基础系列随笔汇总

一共 15 篇随笔,主要是为了记录数据分析过程中的一些小 demo,分享给其他需要的网友,更为了方便以后自己查看,15 篇随笔,每篇内容基本都是以一句说明加一段代码的方式, 保持简单小巧,看起来也清晰 ,一共可以划分为三个大部分: 第一部分简单介绍数据分析,以一个小例子简单说明了什么是数据分析和 IPython 工具: 第二部分是 NumPy 的基础使用,NumPy 是 Python 包,提供科学计算功能,主要是 ndarray 数组对象: 第三部分是 pandas 的基础使用,主要是 Seri

《利用Python进行数据分析·第2版》第四章 Numpy基础：数组和矢量计算

<利用Python进行数据分析·第2版>第四章 Numpy基础:数组和矢量计算 numpy高效处理大数组的数据原因: numpy是在一个连续的内存块中存储数据,独立于其他python内置对象.其C语言编写的算法库可以操作内存而不必进行其他工作.比起内置序列,使用的内存更少(即时间更快,空间更少) numpy可以在整个数组上执行复杂的计算,而不需要借助python的for循环 4.0 前提知识数据:结构化的数据代指所有的通用数据,如表格型,多维数组,关键列,时间序列等相关包:numpy pa

利用 Python 进行数据分析（五）NumPy 基础：ndarray 索引和切片

概念理解索引即通过一个无符号整数值获取数组里的值. 切片即对数组里某个片段的描述. 一维数组一维数组的索引一维数组的索引和Python列表的功能类似: 一维数组的切片一维数组的切片语法格式为array[index1:index2],意思是从index1索引位置开始,到index2索引(不包括index2)位置结束的一段数组.例如: 当把一个值赋值为一个切片时,该值会作用于此数组片段里每一个元素,例如: 二维数组二维数组的索引当以一维数组的索引方式访问一个二维数组的时候,获取的元素不在