归一化和标准化的使用场景以及归一化和标准化有没有改变数据分布

具体讲解可以看这里: 特征工程中的「归一化」有什么作用? - 微调的回答 - 知乎
https://www.zhihu.com/question/20455227/answer/370658612

从这个答案我们知道,标准化和归一化在数据确定的条件下都是一种线性变化,线性变化有很优良的特征,比如数值排序不会改变。

我自己的理解是这样的,对于归一化,没有改变数据分布,对于标准化,做的事情就是使原来的分布改变为高斯分布,所有改变了数据分布

原文地址:https://www.cnblogs.com/lzida9223/p/10972703.html

时间: 2024-08-29 21:41:05

归一化和标准化的使用场景以及归一化和标准化有没有改变数据分布的相关文章

特征工程2:归一化与标准化

归一化与标准化属于特征预处理的范畴 · 特征预处理是什么? 通过特定的数学统计方法将数据转化为算法要求的数据: 特征预处理在scikit-learn中的模块是:sklearn.preprocessing 对于不同的数据类型,有不同的处理方式,三种常见的数据类型: 数值型 类别型 时间类型 · 这里我们先看数值型的预处理: 标准缩放:有两种常见方式,归一化和标准化. 在特征较多时,并且认为这些特征同等重要,或者算法模型涉及到距离计算时(比如K近邻),为了防止某些特征的值对算法产生的影响过大,需要将

标准化与归一化

标准化(Standardization) 是按某个维度进行标准化,例如有下面的矩阵 >>> X = np.array([[ 1., -1., 2.], ... [ 2., 0., 0.], ... [ 0., 1., -1.]]) 正态分布标准化后的结果就是 array([[ 0. ..., -1.22..., 1.33...], [ 1.22..., 0. ..., -0.26...], [-1.22..., 1.22..., -1.06...]]) 归一化(Normalization

转:数据标准化/归一化normalization

转自:数据标准化/归一化normalization 这里主要讲连续型特征归一化的常用方法.离散参考[数据预处理:独热编码(One-Hot Encoding)]. 基础知识参考: [均值.方差与协方差矩阵] [矩阵论:向量范数和矩阵范数] 数据的标准化(normalization)和归一化 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间.在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较

归一化 (Normalization)、标准化 (Standardization)和中心化/零均值化 (Zero-centered)

博主学习的源头,感谢!https://www.jianshu.com/p/95a8f035c86c 归一化 (Normalization).标准化 (Standardization)和中心化/零均值化 (Zero-centered)归一化:1)把数据变成(0,1)或者(1,1)之间的小数.标准化:使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均).标准差变为1中心化:平均值为0,对标准差无要求归一化和标准化的区别:归一化是将样本的特征值转换到同一量纲下把数据映射到[0,1

归一化的优点和方法

作者:zhanlijun 针对这个问题参考了wiki的解释: http://en.wikipedia.org/wiki/Feature_scaling.归一化后有两个好处:1)归一化后加快了梯度下降求最优解的速度:2)归一化有可能提高精度”. 1 归一化为什么能提高梯度下降法求解最优解的速度? 斯坦福机器学习视频做了很好的解释: https://class.coursera.org/ml-003/lecture/21 如下图所示,蓝色的圈圈图代表的是两个特征的等高线.其中左图两个特征X1和X2的

为什么一些机器学习模型需要对数据进行归一化?

为什么一些机器学习模型需要对数据进行归一化? http://www.cnblogs.com/LBSer/p/4440590.html 针对这个问题参考了wiki的解释:http://en.wikipedia.org/wiki/Feature_scaling.“归一化后有两个好处:1)归一化后加快了梯度下降求最优解的速度:2)归一化有可能提高精度”. 1 归一化为什么能提高梯度下降法求解最优解的速度? 斯坦福机器学习视频做了很好的解释:https://class.coursera.org/ml-0

R语言归一化处理

归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内.首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快. R语言中的归一化函数:scale 数据归一化包括数据的中心化和数据的标准化. 1. 数据的中心化所谓数据的中心化是指数据集中的各项数据减去数据集的均值.例如有数据集1, 2, 3, 6, 3,其均值为3,那么中心化之后的数据集为1-3,2-3,3-3,6-3,3-3,即:-2,-1,0,3,0 2. 数据的标准化所谓数据的标准化是指中心化之后的数

OpenCv 011---像素归一化

1 前备知识 归一化:把数据变成(0,1)或者(1,1)之间的小数,主要是为了方便数据处理.归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量.有以下几种方式: (1)x' = (x-x_min)/(x_max-x_min) 其中,x是归一化前的值,x'是归一化后的值,x_max.x_min分别是样本的最大最小值: (2)平均归一化:x' = (x-u)/(x_max-x_min) 其中,x是归一化前的值,x'是归一化后的值,u是样本的均值,x_max.x_m

数据的归一化处理

数据的标准化(normalization)和归一化 数据的标准化 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间.在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权. 目前数据标准化方法:直线型方法(如极值法.标准差法).折线型方法(如三折线法).曲线型方法(如半正态性分布).不同的标准化方法,对系统的评价结果会产生不同的影响,然而不幸的是,在数据标准化方法的选择上,还没有通用的