numpy数组-标准化数据

标准化数据的公式: (数据值 - 平均数) / 标准差

 1 import numpy as np
 2
 3 employment = np.array([
 4     55.70000076,  51.40000153,  50.5       ,  75.69999695,
 5     58.40000153,  40.09999847,  61.5       ,  57.09999847,
 6     60.90000153,  66.59999847,  60.40000153,  68.09999847,
 7     66.90000153,  53.40000153,  48.59999847,  56.79999924,
 8     71.59999847,  58.40000153,  70.40000153,  41.20000076
 9 ])
10
11 mean = employment.mean()         #计算平均数
12 deviation = employment.std()     #计算标准差
13 # 标准化数据的公式: (数据值 - 平均数) / 标准差
14 standardized_employment = (employment - mean) / deviation
15 print (standardized_employment)  

结果:

1   [-0.31965231 -0.780123   -0.87650077  1.82207181 -0.03051941 -1.99019768
2   0.30144772 -0.16973184  0.23719615  0.84758731  0.18365304  1.00821665
3   0.87971351 -0.56595055 -1.07996476 -0.20185762  1.38301845 -0.03051941
4   1.2545153  -1.87240259]

原文地址:https://www.cnblogs.com/liulangmao/p/9119595.html

时间: 2024-10-10 17:23:23

numpy数组-标准化数据的相关文章

NumPy来自现有数据的数组

NumPy - 来自现有数据的数组 这一章中,我们会讨论如何从现有数据创建数组. numpy.asarray 此函数类似于numpy.array,除了它有较少的参数. 这个例程对于将 Python 序列转换为ndarray非常有用. numpy.asarray(a, dtype = None, order = None) 构造器接受下列参数: 序号 参数及描述 1. a 任意形式的输入参数,比如列表.列表的元组.元组.元组的元组.元组的列表 2. dtype 通常,输入数据的类型会应用到返回的n

numpy 数组对象

numpy 数组对象NumPy中的ndarray是一个多维数组对象,该对象由两部分组成:实际的数据,描述这些数据的元数据# eg_v1 import numpy as np a = np.arange(5) # 创建一个包含5个元素的NumPy数组a,取值分别为0~4的整数 print (a) # [0 1 2 3 4] print (a.dtype) # dtype 查看数组的数据类型 # int32 (数组a的数据类型为int32) # 确定数组的维度(数组的shape属性返回一个元组(tu

numpy数组

1.创建数组 import numpy as np a=np.array([1,2,3,4],[4,5,6,7],[7,8,9,10])查看:a.shape | (3,4)a.shape = 4,3 | 改变为4*3形状 a.shape = 2,-1 | -1代表自动计算长度a.dtype | 返回元素类型('int32')也可通过dtype指定创建数组元素的类型b = np.array([1,2,3],dtype=np.float) np.arange(0,1,0.1) 开始值.终值.步长,不

Python numpy数组扩展效率问题

Numpy库的ndarray数组可以方便地进行各种多维数据处理工作 可是它最大的缺点就是不可动态扩展--"NumPy的数组没有这种动态改变大小的功能,numpy.append()函数每次都会重新分配整个数组,并把原来的数组复制到新数组中."(引用自http://blog.chinaunix.net/uid-23100982-id-3164530.html) 场景: 今天用ndarray处理 42000 条数据时,就遇到了数组扩展的效率问题 文件名:train.csv(后附下载) 文件大

【Python实战15】NumPy数组的创建

NumPy提供了一个N维数组对象,即:ndarray.ndarray是一个通用的同构数据多维容器,也就是说,其中的所有元素必须是相同类型的. 创建ndarray数组 创建数组最简单的方式就是使用array函数,它接受一切序列型的对象,然后产生一个新的含有传入数据的NumPy数组.如下: 嵌套的序列将会被转换为一个多为数组: 除非显示的说明,np.array会尝试为新建的这个数组推断出一个较为合适的数据类型,我们可以通过dtype来进行查看,比如上面刚建立的数组类型为:int32类型:另,我们可以

NumPy数组基本的索引和切片

对一维数组来说,NumPy数组的索引切片与Python列表的功能差不多: >>> arr array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) >>> arr[3] 3 >>> arr[2:6] array([2, 3, 4, 5]) >>> arr[3:] array([3, 4, 5, 6, 7, 8, 9]) 但是,特别注意的是,如果要将一个标量值赋值给一个切片,这个修改会直接反映到源数组上(即使你已经新建

Numpy数组对象的操作-索引机制、切片和迭代方法

前几篇博文我写了数组创建和数据运算,现在我们就来看一下数组对象的操作方法.使用索引和切片的方法选择元素,还有如何数组的迭代方法. 一.索引机制 1.一维数组 In [1]: a = np.arange(10,16) In [2]: a Out[2]: array([10, 11, 12, 13, 14, 15]) #使用正数作为索引 In [3]: a[3] Out[3]: 13 #还可以使用负数作为索引 In [4]: a[-4] Out[4]: 12 #方括号中传入多数索引值,可同时选择多个

numpy数组属性

NumPy 数组的维数称为秩(rank),即数组的维度. NumPy中,每一个线性的数组称为是一个轴(axis),axis=0,表示沿着第 0 轴进行操作,即对每一列进行操作:axis=1,表示沿着第1轴进行操作,即对每一行进行操作. NumPy 的数组中比较重要 ndarray 对象属性有: 属性 说明 ndarray.ndim 秩,即轴的数量或维度的数量 ndarray.shape 数组的维度,对于矩阵,n 行 m 列 ndarray.size 数组元素的总个数,相当于 .shape 中 n

数据分析(1) Numpy数组

Numpy的数组类被称作ndarray,通常被称作数组. 特点:元素类型相同,数量事先给定. 1 创建方式 (1)array( ):接收一个普通的Python序列(元组与列表并无区别),并将其转换为ndarray: # 使用列表创建 list1 = [1, 2, 3, 4, 5] print('使用一维列表创建:\n', np.array(list1)) list2 = [[1, 2, 3], [4, 5, 6]] print('使用二维列表创建:\n', np.array(list2)) #