机器学习之路:python 字典特征提取器 DictVectorizer

python3 学习使用api

将字典类型数据结构的样本,抽取特征,转化成向量形式

源码git: https://github.com/linyi0604/MachineLearning

代码:

 1 from sklearn.feature_extraction import DictVectorizer
 2
 3 ‘‘‘
 4 字典特征提取器:
 5     将字典数据结构抽和向量化
 6     类别类型特征借助原型特征名称采用0 1 二值方式进行向量化
 7     数值类型特征保持不变
 8 ‘‘‘
 9
10 # 定义一个字典列表 用来表示多个数据样本
11 measurements = [
12     {"city": "Dubai", "temperature": 33.0},
13     {"city": "London", "temperature": 12.0},
14     {"city": "San Fransisco", "temperature": 18.0},
15 ]
16
17 # 初始化字典特征抽取器
18 vec = DictVectorizer()
19 data = vec.fit_transform(measurements).toarray()
20 # 查看提取后的特征值
21 print(data)
22 ‘‘‘
23 [[ 1.  0.  0. 33.]
24  [ 0.  1.  0. 12.]
25  [ 0.  0.  1. 18.]]
26 ‘‘‘
27 # 查看提取后特征的含义
28 print(vec.get_feature_names())
29 ‘‘‘
30 [‘city=Dubai‘, ‘city=London‘, ‘city=San Fransisco‘, ‘temperature‘]
31 ‘‘‘

原文地址:https://www.cnblogs.com/Lin-Yi/p/8973252.html

时间: 2024-10-09 02:19:34

机器学习之路:python 字典特征提取器 DictVectorizer的相关文章

Python之路-python(装饰器、生成器、迭代器、Json & pickle 数据序列化、软件目录结构规范)

装饰器: 首先来认识一下python函数, 定义:本质是函数(功能是装饰其它函数),为其它函数添加附件功能        原则:        1.不能修改被装饰的函数的源代码.        2.不能修改被装饰的函数的调用方式. 1 def test(): 2 print('test') 3 print(test ) #表示是函数 4 test() #表示执行foo函数 <function test at 0x00595660>#表示的是函数的内存地址test#函数test执行结果 简单的装

机器学习之路: python k近邻分类器 鸢尾花分类预测

使用python语言 学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/kaggle 1 from sklearn.datasets import load_iris 2 from sklearn.cross_validation import train_test_split 3 from sklearn.preprocessing import StandardScaler 4 from sklearn.neighbors i

机器学习之路: python 决策树分类 预测泰坦尼克号乘客是否幸存

使用python3 学习了决策树分类器的api 涉及到 特征的提取,数据类型保留,分类类型抽取出来新的类型 需要网上下载数据集,我把他们下载到了本地, 可以到我的git下载代码和数据集: https://github.com/linyi0604/MachineLearning 1 import pandas as pd 2 from sklearn.cross_validation import train_test_split 3 from sklearn.feature_extraction

机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价

python3学习使用api 线性回归,和 随机参数回归 git: https://github.com/linyi0604/MachineLearning 1 from sklearn.datasets import load_boston 2 from sklearn.cross_validation import train_test_split 3 from sklearn.preprocessing import StandardScaler 4 from sklearn.linear

机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价

python3 学习api的使用 git: https://github.com/linyi0604/MachineLearning 代码: 1 from sklearn.datasets import load_boston 2 from sklearn.cross_validation import train_test_split 3 from sklearn.preprocessing import StandardScaler 4 from sklearn.tree import De

PyCon 2014:机器学习应用占据Python的半壁江山

来自http://www.infoq.com/cn/news/2014/07/pycon-2014 今年的PyCon于4月9日在加拿大蒙特利尔召开,凭借快速的原型实现能力, Python在学术界得到了广泛应用.最近其官方网站发布了大会教程部分的视频和幻灯片,其中有很多(接近一半数量)跟数据挖掘和机器学习相关的内容,本文对此逐一介绍. 如何形式化一个科学问题然后用Python进行分析 目前有很多很强大Python数据挖掘库,比如Python语言的交互开发环境IPython,Python机器学习库S

Python之装饰器、迭代器和生成器

在学习python的时候,三大“名器”对没有其他语言编程经验的人来说,应该算是一个小难点,本次博客就博主自己对装饰器.迭代器和生成器理解进行解释. 为什么要使用装饰器 什么是装饰器?“装饰”从字面意思来谁就是对特定的建筑物内按照一定的思路和风格进行美化的一种行为,所谓“器”就是工具,对于python来说装饰器就是能够在不修改原始的代码情况下给其添加新的功能,比如一款软件上线之后,我们需要在不修改源代码和不修改被调用的方式的情况下还能为期添加新的功能,在python种就可以用装饰器来实现,同样在写

如何用python的装饰器定义一个像C++一样的强类型函数

Python作为一个动态的脚本语言,其函数在定义时是不需要指出参数的类型,也不需要指出函数是否有返回值.本文将介绍如何使用python的装饰器来定义一个像C++那样的强类型函数.接下去,先介绍python3中关于函数的定义. 0. python3中的函数定义 举个例子来说吧,比如如下的函数定义: 1 def fun(a:int, b=1, *c, d, e=2, **f) -> str: 2 pass 这里主要是说几点与python2中不同的点. 1)分号后面表示参数的annotation,这个

Python 黑魔法 --- 描述器(descriptor)

Python 黑魔法---描述器(descriptor) Python黑魔法,前面已经介绍了两个魔法,装饰器和迭代器,通常还有个生成器.生成器固然也是一个很优雅的魔法.生成器更像是函数的行为.而连接类行为和函数行为的时候,还有一个描述器魔法,也称之为描述符. 我们不止一次说过,Python的优雅,很大程度在于如何设计成优雅的API.黑魔法则是一大利器.或者说Python的优雅很大程度上是建立在这些魔法巧技基础上. 何谓描述器 当定义迭代器的时候,描述是实现迭代协议的对象,即实现__iter__方