azure Machine learing studio 使用示例之 - 使用线性回归算法完成预测评估

本文演示如何使用azure studio基于云测试数据创建第一个machine learning的experiment,算法选择是线性回归。
首先要有一个azure studio账号,登录后进入dashboard。

创建一个BLANK的Experiment

添加测试数据 , 搜索Price, 选择Automibile price data(Raw)

把这个模块拖到右边的data item位置

搜索Project column模块,拖到右边,在Project columns中点击 ‘Launch column selector‘

希望以所有列作为映射的输入,过滤掉normalized-losses列,如下配置

现在要过滤掉一些无效数据所在的行,搜索clean missing data->选择模块拖到右边->点击模块->将cleaning mode选择为remove entire row

点击Launch Column selector,选择一些列

再次搜索并添加Project columns 模块,拖到右边,点击launch columns selector ,

选择price即可,因为接下来只是对price列进行预测,其他列只作为算法的培训数据。

添加一个split模块,目的是将测试数据分开使用,本例中以80%作为培训数据,20%的数据作为测试数据,计算验证结果的准确程度。在本模块中,设置作为学习数据的百分比以及随机种子。

接下来添加算法模块,搜索‘regression‘,在回归算法中选择线性回归,拖到右边

添加train model,使用测试数据进行学习

点击’Launch Column Selector‘,选择输出的列,这里依然为‘price‘

现在可以点击下面的‘run‘进行运行。

最后,添加score module,链接上面train model和之前的split module输出的第二个dataset,用于误差分析

添加evaluate module,进行结果评估

点击‘run‘进行运行。

右键 Evaluate Module -> Evaluate Results -> visualize ,可以看到本次Experiment的精确程度

时间: 2024-10-14 19:06:16

azure Machine learing studio 使用示例之 - 使用线性回归算法完成预测评估的相关文章

利用Microsoft Azure Machine Learning Studio创建机器学习实例

Microsoft Azure云服务推出机器学习的模块,用户只需上传数据,利用机器学习模块提供的一些算法接口和R语言或别的语言接口,就能利用Microsoft Azure强大的云计算能力来实现自己的机器学习的任务. 本文浅尝了该机器学习模块,参照官方实例和帮助文档,完成了一个简单的应用实例,具体步骤如下. 1.新建workspace 注意,在填写workspace owner,一定要填写一个有效的windows live 账号 进入创建的workspace,界面如下图所示 2.上传数据 数据源:

微软机器学习Azure Machine Learning入门概览

Azure Machine Learning(简称“AML”)是微软在其公有云Azure上推出的基于Web使用的一项机器学习服务,机器学习属人工智能的一个分支,它技术借助算法让电脑对大量流动数据集进行识别.这种方式能够通过历史数据来预测未来事件和行为,其实现方式明显优于传统的商业智能形式.微软的目标是简化使用机器学习的过程,以便于开发人员.业务分析师和数据科学家进行广泛.便捷地应用.这款服务的目的在于“将机器学习动力与云计算的简单性相结合”.AML目前在微软的Global Azure云服务平台提

SharePoint 2013 工作流之Visual Studio开发示例篇

原文:SharePoint 2013 工作流之Visual Studio开发示例篇 SharePoint 2013引用了WF4.0 Foundation,支持使用Designer和Visio进行设计,但是功能受限,而Visual Studio可以开发功能更加丰富的工作流,下面我们简单举个例子. 1.本例使用的是VS 2013版本,新建一个SharePoint空项目: 2.部署为服务器场解决方案,如下图: 3.添加新项,选择工作流模板,如下图: 4.本例选择列表工作流,当然你按照自己的需要选择:

Machine Learning笔记(三) 多变量线性回归

Machine Learning笔记(三) 多变量线性回归 注:本文内容资源来自 Andrew Ng 在 Coursera上的 Machine Learning 课程,在此向 Andrew Ng 致敬. 一.多特征(Multiple Features) 笔记(二)中所讨论的房价问题,只考虑了房屋尺寸(Size)一个特征,如图所示: 这样只有单一特征的数据,往往难以帮助我们准确的预测房价走势.因此,考虑采集多个特征的数据值,往往能提升预测效果.例如,选取如下4个特征作为输入值时的情况: 对一些概念

[Azure] 使用 Visual Studio 2013 管理中国版 Azure 订阅

比较关心微软平台技术的朋友应该都知道,微软云服务(Microsoft Azure)以下简称Azure分为全球版和中国版,由于政府法规问题中国版的服务是由二十一世纪互联运营,整体来看中国版Azure和全球版从运营,功能以及使用方式上都存在一些差别,而对于做开发的朋友来说,能够使用统一的工具来管理云服务以及开发资源无疑是一个非常方便的方式,Visual Studio作为微软统一开发工具也对Azure做了非常强大的管理及使用的支持. 然而对于中国版Azure来说,首先其验证方式不是使用Microsof

Azure Storage Blob Go SDK示例

简介 前面一篇博客介绍了关于Azure ManagerAPI Go SDK的使用,本篇继续介绍使用Blob Go SDK 操作中国区Azure Blob. SDK下载: go get github.com/Azure/azure-storage-blob-go/2016-05-31/azblob 示例程序: package main import ( "bufio" "bytes" "context" "fmt" "

【投稿】Machine Learing With Spark Note 3:构建分类器

本文为数盟特约作者投稿,欢迎转载,请注明出处"数盟社区"和作者 博主简介:段石石,1号店精准化推荐算法工程师,主要负责1号店用户画像构建,喜欢钻研点Machine Learning的黑科技,对Deep Learning感兴趣,喜欢玩kaggle.看9神,对数据和Machine Learning有兴趣咱们可以一起聊聊,个人博客: hacker.duanshishi.com Spark构建分类器 在本章中,我们会了解基本的分类器以及在Spark如何使用,以及一套如何对model进行评价.调

hdu 1150 Machine Schedule(二分匹配,简单匈牙利算法)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1150 Machine Schedule Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 6733    Accepted Submission(s): 3375 Problem Description As we all know, mach

<Machine Learning in Action >之四 二分k-均值算法 C#实现图像分割

using System; using System.Drawing; using System.Windows.Forms; using System.Threading; using System.Collections.Generic; namespace K_means { public partial class Form1 : Form { const int pictureSize = 640 * 480; const int k = 3; //质心的数量 Color[] arra