什么情况需要数据归一化处理?

当GDP变动百分之几的时候,可能往往数量是多少百万元,多少千万元,甚至多少亿元作为单位的量纲,但如果我们考察的是区域内的企业个数与GDP的关系时(比如做灰色关联度分析),就会出现变化相同的百分比,在绝对值上相差太多,一个的量纲是亿,而另一个的量纲却是个(毕竟区域内的企业一般也就几百到几千个),所以为了分析统计的方便,要进行归一化处理,把它们处理在(0,1)之间。

参考:

http://bbs.pinggu.org/thread-708553-1-1.html

时间: 2024-10-23 14:34:12

什么情况需要数据归一化处理?的相关文章

数据归一化的两种常用方法

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性.原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价.以下是两种常用的归一化方法: 一.min-max标准化(Min-Max Normalization) 也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间.转换函数如下: 其中max为样本数据的最大

数据归一化小结

在各种模型训练,特征选择相关的算法中,大量涉及到数据归一化的问题.比如最常见的情况是计算距离,如果不同维度之间的取值范围不一样,比如feature1的取值范围是[100,200],feature2的取值范围是[1,2],如果数据不做归一化处理,会造成feature1在距离计算中占压倒性的优势,feature2完全体现不出来作用.而数据做归一化处理以后,会让各个不同特征对距离计算的贡献大致相同,从而避免人为的数据倾斜. 常见的数据归一化方式如下: 1.线性归一化 如果要把输入数据转换到[0,1]的

第四十九篇 入门机器学习——数据归一化(Feature Scaling)

No.1. 数据归一化的目的 数据归一化的目的,就是将数据的所有特征都映射到同一尺度上,这样可以避免由于量纲的不同使数据的某些特征形成主导作用. No.2. 数据归一化的方法 数据归一化的方法主要有两种:最值归一化和均值方差归一化. 最值归一化的计算公式如下: 最值归一化的特点是,可以将所有数据都映射到0-1之间,它适用于数据分布有明显边界的情况,容易受到异常值(outlier)的影响,异常值会造成数据的整体偏斜. 均值方差归一化的计算公式如下: 均值方差归一化的特点是,可以将数据归一化到均值为

数据归一化/标准化

''' [课程2.3] 数据归一化/标准化 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间. 在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权 最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上 0-1标准化 / Z-score标准化 ''' import numpy as np import pandas as pd import matplotlib.pypl

数据归一化

数据归一化 数据的标准化是将数据按比例缩放,使之落入一个小的特定区间,一般为0到1之间.在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权. 常见的数据归一化的方法有: 1.min-max标准化(离差标准化) 是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下: 其中max为样本数据的最大值,min为样本数据的最小值.这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义. 2.

matlab 数据归一化

图像数据归一化 depth为源图像,数据分布在[0 63],归一化到[0 255] xmin = min(min(depth));xmax = max(max(depth));ymin = 0;ymax = 255;depth1 = (ymax-ymin)*(depth-ones(m,n) * xmin)/(xmax-xmin) + ones(m,n)*ymin;figure;imshow(uint8(depth1));

Android中突发情况Activity数据的保存和恢复

Android中突发情况Activity数据的保存和恢复 写在前面:在我们的APP使用的过程中,总有可能出现各种手滑.被压在后台.甚至突然被杀死的情况.所以对APP中一些临时数据或关键持久型数据,就需要我们使用正确的方式进行保存或恢复. 突发情况都有哪些? 因为本文讨论的是当一些突发情况的出现时,对数据的保存和恢复.所以现在总结一下突发情况应该都有哪些? 点击back键 点击锁屏键 点击home键 其他APP进入前台 启动了另一个Activity 屏幕方向旋转 APP被Kill 当这些突发情况发

MATLAB实例:聚类初始化方法与数据归一化方法

MATLAB实例:聚类初始化方法与数据归一化方法 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 1. 聚类初始化方法:init_methods.m function label=init_methods(data, K, choose) % 输入:无标签数据,聚类数,选择方法 % 输出:聚类标签 if choose==1 %随机初始化,随机选K行作为聚类中心,并用欧氏距离计算其他点到其聚类,将数据集分为K类,输出每个样例的类标签 [X_num,

数据归一化和两种常用的归一化方法

数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性.原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价.以下是两种常用的归一化方法: 一.min-max标准化(Min-Max Normalization) 也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 - 1]之间.转换函数如下: 其中max为样本数据的最大