第二节数值型特征进行归一化或标准化处理

数值型特征处理：通过特定的统计方法将数据转换成算法要求的数据，归一化和标准化

# 归一化的计算公式决定了其对异常值很敏感，一旦出现异常值会导致鲁棒性较差，所以归一化只适合传统精确小数据场景
from sklearn.preprocessing import MinMaxScaler

def mm():
    # feature_range指定归一化后的数据范围，不指定就是0-1之间
    mm = MinMaxScaler(feature_range=(2, 3))

    # fit_transform接收数组
    data = mm.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]])

    print(data)

if __name__ == "__main__":
    mm()

# 标准化也是用来去除量纲的影响，但是在大数据量下，其对异常值的耐受性比较好
from sklearn.preprocessing import StandardScaler

def stand():
    std = StandardScaler()

    # fit_transform接收数组
    data = std.fit_transform([[1, -1, 3], [2, 4, 2], [4, 6, -1]])

    print(data)

if __name__ == "__main__":
    stand()

原文地址：https://www.cnblogs.com/kogmaw/p/12566209.html

时间： 2024-10-09 14:45:49

第二节数值型特征进行归一化或标准化处理的相关文章

第二节数值、字符与字符串

数值:在电脑中以二进制的方式存储的字符:也是二进制方式在电脑上存储的,但是与数值不通,字符是以编码形式来显示的, 例如:ASC|| 码 GB2312.UTF8等字符串:是有一个或多个字符组合起来的,编译器会默认在字符串末尾加上‘\0’(\0表示是结尾) 数值和字符比较 1.存储空间 2.意义差别数值字符串十进制:65535 "121" 计算机中:1111 1111 1111 1111

什么是特征缩放: 就是将所有数据映射到同一尺度.如: 某训练集 x_train 为: (x_trian) 将其进行某种特征缩放之后,得到新的值: 显然经过特征缩放之后,特征值变小了为什么要进行特征缩放呢? 有些特征的值是有区间界限的,如年龄,体重.而有些特征的值是可以无限制增加,如计数值. 所以特征与特征之间数值的差距会对模型产生不良影响.如: 在该样本集中,由于量纲不同,模型受 '次数'特征所主导.因此如果没有对数据进行预处理的话有可能带来偏差,难以较好的反应特征之间的重要程度.其实还有利

数据预处理 | 使用 sklearn.preprocessing.OrdinalEncoder 将分类特征转换为数值型

from sklearn.preprocessing import OrdinalEncoder model_oe = OrdinalEncoder() string_data_array = model_oe.fit_transform(string_data) string_data_pd = pd.DataFrame(string_data_con,columns=string_data.columns) 说明: 1 string_data 是挑出来的需要转成数值型特征的分类特征

第二节什么是接口

什么是接口主讲教师:王少华 QQ群号:483773664 学习目标掌握接口的定义与使用理解接口与抽象类的区别一.什么是接口现实生活中,我们经常听到接口这个词,比如USB接口,那它是什么意思呢?我们拿USB接口为例,不管那个厂商生产的USB存储器,我们都可以通过USB接口让电脑识别出来,这是为什么呢?这是因为这些生产厂商遵循了一套相同的标准,并按照这个标准来生成USB设备. 在软件中,接口同样是一种规范和标准,它们可以约束类的行为,是一些方法特征的集合,但是没有方法的实现.因此,

2014年辛星解读css第二节

第一节我们简介了一下CSS的工作流程,我相信读者会有一个大体的认识,那么接下来我们将会深入的研究一下CSS的细节问题,这些问题的涉及将会使我们的工作更加完善. *************注释************ 1.CSS也是需要注释的,注释中的内容不会被解释执行,它也和C语言一样,用/*开头,用*/结尾,其中的内容会被当做注释,我们想怎么写就怎么写. 2.下面给个例子: p{ color: green; /* 我们在这里书写注释 * 辛星CSS,与博客园共同成长 */ font-size:

2014年度辛星css教程夏季版第二节

特征工程2:归一化与标准化

归一化与标准化属于特征预处理的范畴 · 特征预处理是什么? 通过特定的数学统计方法将数据转化为算法要求的数据: 特征预处理在scikit-learn中的模块是:sklearn.preprocessing 对于不同的数据类型,有不同的处理方式,三种常见的数据类型: 数值型类别型时间类型 · 这里我们先看数值型的预处理: 标准缩放:有两种常见方式,归一化和标准化. 在特征较多时,并且认为这些特征同等重要,或者算法模型涉及到距离计算时(比如K近邻),为了防止某些特征的值对算法产生的影响过大,需要将

杨森翔：春节文化大观上编第三章春节古诗词目录第一节：春节诗词概述一、除夕诗词概述二、元日诗词概述三、元宵诗词概述第二节：春节古诗词拾萃

杨森翔:春节文化大观上编第三章春节古诗词目录第一节:春节诗词概述一. 除夕诗词概述二.元日诗词概述三. 元宵诗词概述第二节:春节古诗词拾萃一.腊祭诗词二.祭灶诗词三.除夕诗词四.元旦诗词五.人日诗词六.元宵诗词第一节:春节古诗词概述中国的春节,作为除旧迎新的节日,时间相当长,从年前的腊月二十三,天空中就似乎弥漫了节日的气息.这种节日的气氛,在保持传统风俗较好的地方,甚至会持续到二月二龙抬头的时候,但欢度春节的高潮,应该说是自除夕始一直到上元之夜.因此,历代歌咏和反

Python基本语法_基本数据类型_数值型详解

目录目录软件环境 Python变量调用的过程数值型删除一个数值类型对象布尔型 Bool 标准整型 Int 长整型双精度浮点型 Float 复数数值类型对象的内建功能函数 absNumber 求Number的绝对值 coercex y 将x y转换为同一种数值类型 divmodx y 除法-取余运算的结合 pow 指数运算或将结果取余 round 浮点型的四舍五入运算和求精度仅用于整型对象的函数软件环境系统 CentOS 7 软件 Python 2.7.5 IPython 5.

第二节 数值型特征进行归一化或标准化处理

第二节 数值型特征进行归一化或标准化处理的相关文章

第二节数值型特征进行归一化或标准化处理

第二节数值型特征进行归一化或标准化处理的相关文章