机器学习实战1-2 KNN改进约会网站的配对效果 datingTestSet2.txt 下载方法

今天读《机器学习实战》读到了使用k-临近算法改进约会网站的配对效果，道理我都懂，但是看到代码里面的数据样本集 datingTestSet2.txt 有点懵，这个样本集在哪里，只给了我一个文件名，没有任何内容啊。

上网百度了这个文件名，发现很多博主的博客里可以下载，我很好奇，同样是读《机器学习实战》，他们是从哪里下载的数据样本集呢？就重新读了这本书。终于在“关于本书”最后的“作者在线里面”找到了网址！就是这个，大家需要可以来这里下载。

http:/www.manning.com/MachineLearninginAction

然后我记录一下我的下载过程：

点击Source Code 就可以啦~

原文地址：https://www.cnblogs.com/rougan/p/9295659.html

时间： 2024-10-13 11:34:51

机器学习实战1-2 KNN改进约会网站的配对效果 datingTestSet2.txt 下载方法的相关文章

机器学习实战——第二章之改进约会网站的配对效果

三种类型:不喜欢的-1,魅力一般的-2,极具魅力的-3. 样本特征:每年获得的飞行常客里程数,玩视频游戏所耗时间百分比,每周消费的冰淇淋公升数. 1 from numpy import * 2 import matplotlib 3 import matplotlib.pyplot as plt 4 5 ''' 6 输入文本文件名字符串,输出训练样本矩阵和类标签向量 7 ''' 8 def file2matrix(filename): 9 fr = open(filename) 10 array

机器学习实战笔记-K近邻算法2(改进约会网站的配对效果)

案例二.:使用K-近邻算法改进约会网站的配对效果案例分析: 海伦收集的数据集有三类特征,分别是每年获得的飞行常客里程数.玩视频游戏所耗时间百分比. 每周消费的冰淇淋公升数.我们需要将新数据的每个新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签.一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数.最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类. 流程:在约会网站上使用K

KNN算法项目实战——改进约会网站的配对效果

KNN项目实战--改进约会网站的配对效果 1.项目背景: 海伦女士一直使用在线约会网站寻找适合自己的约会对象.尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人.经过一番总结,她发现自己交往过的人可以进行如下分类: 不喜欢的人魅力一般的人极具魅力的人 2.项目数据海伦收集约会数据已经有了一段时间,她把这些数据存放在文本文件datingTestSet.txt中,每个样本数据占据一行,总共有1000行. datingTestSet.txt数据集下载海伦收集的样本数据主要包含以下3种特征:

机器学习实战笔记——利用KNN算法改进约会网站的配对效果

一.案例背景我的朋友海伦一直使用在线约会网站寻找合适自己的约会对象.尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人.经过一番总结,她发现曾交往过三种类型的人: (1)不喜欢的人: (2)魅力一般的人: (3)极具魅力的人: 尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象归入恰当的分类,她觉得可以在周一到周五约会那些魅力一般的人,而周末则更喜欢与那些极具魅力的人为伴.海伦希望我们的分类软件可以更好地帮助她将匹配对象划分到确切的分类中.此外,海伦还收集了一些约会网站未曾记录的数据

《机器学习实战》之k-近邻算法（改进约会网站的配对效果）

示例背景: 我的朋友海伦一直使用在线约会网站寻找合适自己的约会对象.尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人.经过一番总结,她发现曾交往过三种类型的人: (1)不喜欢的人: (2)魅力一般的人: (3)极具魅力的人: 尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象归入恰当的分类,她觉得可以在周一到周五约会那些魅力一般的人,而周末则更喜欢与那些极具魅力的人为伴.海伦希望我们的分类软件可以更好地帮助她将匹配对象划分到确切的分类中.此外,海伦还收集了一些约会网站未曾记录的数据信

《机器学习实战》代码实现学习一使用K-近邻算法改进约会网站的配对效果(数据准备)

1.数据准备:从文本文件中解析数据文本文件datingTestSet2.txt网盘地址为: https://pan.baidu.com/s/19HNwo1TSWjWhbRwsyL-itg 提取码为:mz11 约会数据由1000行,主要包含一下三种特征: 每年获得的飞行常客里程数玩视频游戏所耗时间百分比每周消费的冰淇淋公升数但是在把这些特征输入到分类器之前,必须将待处理数据格式改变为分类器可以接受的格式,在kNN.py中创建名为file2matrix的函数,以此来处理输入格式问题,该函数的

吴裕雄--天生自然python机器学习：使用K-近邻算法改进约会网站的配对效果

在约会网站使用K-近邻算法准备数据:从文本文件中解析数据海伦收集约会数据巳经有了一段时间,她把这些数据存放在文本文件(1如1^及抓比加中,每个样本数据占据一行,总共有1000行.海伦的样本主要包含以下3种特征: 每年获得的飞行常客里程数玩视频游戏所耗时间百分比每周消费的冰淇淋公升数将文本记录到转换NumPy的解析程序 import operator from numpy import * from os import listdir def file2matrix(filenam

K-近邻算法改进约会网站的配对效果

摘自:<机器学习实战>,用python编写的(需要matplotlib和numpy库) 海伦一直使用在线约会网站寻找合适自己的约会对象.尽管约会网站会推荐不同的人选,但她没有从中找到喜欢的人.经过一番总结,她发现曾交往过三种类型的人: 1.不喜欢的人( 以下简称1 ): 2.魅力一般的人( 以下简称2 ): 3.极具魅力的人(以下简称3 ) 尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象归入恰当的分类.她觉得可以在周一到周五约会哪些魅力一般的人,而周末则更喜欢与那些极具魅力的人为伴

使用k-近邻算法改进约会网站的配对效果

---恢复内容开始--- < Machine Learning 机器学习实战>的确是一本学习python,掌握数据相关技能的,不可多得的好书!! 最近邻算法源码如下,给有需要的入门者学习,大神请绕道. 数字识别文件 ''' Created on Sep 16, 2010 kNN: k Nearest Neighbors Input: inX: vector to compare to existing dataset (1xN) dataSet: size m data set of know

猜你喜欢

一个简单的购物类网站

最近给学校做了一个购物类的网站:捐赠网站;模式和淘宝是一样的:选择商品->选择数量->填写留言(评价)->付款(支付宝付款);逻辑比较简单. 接下来的几天,我将就编程中遇到的一些问题 ...

（专题DP）?? ?(?_?)? ??

题意:几个字母比大小的组合数,注意相同字母还有符号题解:动态规划 DescriptionBackground Consider a specific set of comparable object ...

还是学校里好

今天帮同学在外面提前找好房子,吃完晚饭,在溪源江的路上骑自行车独自回去,并没有往常的夕阳西下,但却让人感到一丝凉爽.一个男生坐在河边的芦苇丛旁低着头看着书,一个红裙子的女生在岸边的小路上捧着书边走边读 ...

List遍历时删除遇到的问题

这周在开发中遇到了一个以前没遇到的小Bug,在这里记录下来. List集合,我们平时都经常使用.但是,我在遍历List集合时,调用了List集合的remove方法来删除集合中的元素,简单的代码结构是这 ...

在VS2013中配置QT5 win7_64

转自在VS2013中配置QT5 win7_64 环境: win x64 + vs2013+QT5+vs_addin 下面示例正确配置QT以及VS2013 + QT Addin开发环境: 下载VS20 ...

jdk 1.8 java.util.concurrent 学习(一)

java.util.concurrent主要分为五个部分: atomic数据类型同步锁并发容器多线程任务执行线程管理 1. atomic(原子) 数据类型放在java.util.concur ...

Make python2.7 use the right version of opencv

Bug: Some day I updated my openCV to the latest version 2.4.13, while recently I found I always get ...

Miller-Rabin质数测试

这种质数算法是基于费马小定理的一个扩展. 费马小定理:对于质数p和任意整数a,有a^p ≡ a(mod p)(同余).反之,若满足a^p ≡ a(mod p),p也有很大概率为质数. 将两边同时约去一 ...

makeinfo的归宿

很多的时候.我们总是寻找百度上的答案.从百度的答案来看makeinfo这个软件包来自Ubuntu的texinfo. 来自Ubuntu的答案: If you would have executed ma ...

让你的浏览器强制在后端服务器执行而不用通过前端CDN服务器

因为后端执行时间过长,前端不等待,导致提示504错误的解决办法 504 错误是因为你的CDN服务器设置的延时有限, 超时导致的504 是前端不等待中止,是前端不行,后端应该正常 502 错误是后端无应 ...

直播－rtmp学习

RTMP(实时消息传输协议),官方介绍如下: Adobe’s Real Time Messaging Protocol (RTMP), an application-level protocol de ...

hdu 1599 find the mincost route(无向图的最小环：求从一个点遍历所有节点以后回到原点的最短路径)

在写题解之前给自己打一下广告哈~..抱歉了,希望大家多多支持我在CSDN的视频课程,地址如下: http://edu.csdn.net/course/detail/209 题目: find the m ...

MVC5-3 Result分析

众多的Result 使用MVC进行开发,可以看到有ActionResult.ContentReuslt.JsonResult..等,今天对这些Result进行背后分析.它到底是如何做到的 Action ...

PMP 项目时间管理

1.规划进度管理输入 1. 项目管理计划 2. 项目章程 3. 事业环境因素 4. 组织过程资产工具与技术 1. 专家判断 2. 分析技术 3. 会议输出 1.进度管理计划 2.定义活动输入 ...

prime算法模板

邻接矩阵的实现int prime(int cost[][MAXV],int n){ bool vis[MAXV]; int dis[MAXV]; memset(vis,false,sizeof(vis ...

Struts2龙之总结

一.Struts2执行流程: 1.客户端初始化一个指向servlet容器(tomcat)的请求: 2.这个请求经过一系列过滤器(Filter): 3.接着StrutsPrepareAndExecute ...

WP开发笔记——去除 HTML 标签

获取到一段HTML类型的信息,显示在WP的webbrowser控件中,如果不加处理的话,会显示出各种神烦的HTML标签. 这时,需要我们将这HTML类型的信息进行处理去除HTML标签后再显示出来,这里 ...

ios数据的基本类型和流程控制

swift的声明变量方式和js是类似的.基本类型基本都和java的差不多,多了字符类型. let:用于声明常量: var:用于声明变量: 基本类型有:double,float,Int(数字类型):bo ...

Oracle中的系统权限管理

在实际的IT项目管理中,对数据库的管理显得尤为重要,一般情况下,数据库的管理工作会有公司中的DBA人员来负责.但是,不是任何有关数据库的操作都要去联系DBA啦,万一人家不在或有其它事情不能立即处理时该 ...

asp.net 获取当月的第一天和最后一天示例

ASP.NET(C#)返回每个月的第一天和最后一天要怎么来做呢,我们下文整理了不少例子,然后根据例子做了一个智能判断每个月有多少天,无需你计算,本函数将替你完成: 希望对各位有帮助. 最简单获取当月第 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.