云计算与数据科学:Microsoft Azure 机器学习与R 简介

通过易于使用的强大的基于云技术的数据处理与机器学习工具,微软Azure机器学习平台 (Azure ML)极大地简化了机器学习模型的开发和部署。

O‘Reilly 发布的技术文档 《 Data Science in the Cloud with Microsoft Azure Machine Learning and R 》介绍了基于Microsoft Azure 机器学子平台 数据操作、建模、模型评估等方面的内容。

该文档利用 R 语言深入探讨了Azure机器学习平台。(另一篇使用 Python 语言的文档已在上篇介绍)

该文档通过一个自行车租赁数据科学案例,详细讨论了数据处理、数据挖掘等内容,并提供了完整的代码。Github: https://github.com/Quantia-Analytics/AzureML-Regression-Example

该文档目录如下:

  • Introduction
  • Overview of Azure ML
  • A Regression Example
  • Improving the Model and Transformations
  • Improving Model Parameter Selection in Azure ML
  • Cross Validation
  • Some Possible Next Steps
  • Publishing a Model as a Web Service
  • Using Jupyter Notebooks with Azure ML
  • Summary

资料原文下载地址:http://www.oreilly.com/data/free/data-science-microsoft-ml-r-2015-update.csp?intcmp=il-data-free-lp-lgen_20151019_radar_data_science_in_the_cloud_with_microsoft_azure_report_post_radar

更多探讨,可以之间邮件沟通。

时间: 2024-12-20 05:04:16

云计算与数据科学:Microsoft Azure 机器学习与R 简介的相关文章

(数据科学学习手札19)R中基本统计分析技巧总结

在获取数据,并且完成数据的清洗之后,首要的事就是对整个数据集进行探索性的研究,这个过程中会利用到各种描述性统计量和推断性统计量来初探变量间和变量内部的基本关系,本篇笔者便基于R,对一些常用的数据探索方法进行总结: 1.描述性统计量部分 1.1 计算描述性统计量的常规方法 summary() summary()函数提供了最小值.最大值.四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计: > #挂载鸢尾花数据 > data(iris) > #计算鸢尾花各变量的基本描述统计量 &

数据科学行业已被挤爆?4点建议献给准备入行的小白

数据科学家被称为"21世纪最性感的职业",也被认为是最容易找工作的职业,但如今,真实情况如何呢? 数据科学刚刚度过了它的黄金五年.自2012年以来,这个行业发展迅速.它几乎完整经历了Gartner技术成熟度曲线的每个阶段. 度过了初期使用阶段.有关AI和偏见的负面新闻.Facebook等公司的第二三轮风投.现在的数据科学正处于高增长使用阶段:即使是银行.医疗保健公司和落后市场五年的其他100强企业,也在招聘机器学习中的数据科学岗位. 但现实正在发生巨大的变化. 来自captech基金的

Microsoft Azure Online Backup介绍

在所有企业中,我们所熟知的IT的最重要资产并不是机房里机架上的服务器.存储.交换机.路由器等硬件设备,而是存储了多年的企业大量的业务数据.因此,在涉及到保护企业业务数据时,IT管理员时常需要完全备份或者增量备份企业所有数据.传统的,企业可能需要购买大量的存储设备以便存储数据,但是在云计算出现之后,基于云的备份解决方案能够提供可靠.廉价且可扩展的解决方案,其资本投入为零,可将运营费用降到最低. 在微软的云计算解决方案中,Microsoft Azure Online Backup是简单.可靠的数据保

数据科学中R VS Python:获胜者是...

数据科学中R VS Python:获胜者是- 在"最佳"数据科学工具的比赛中,R和Python都有自己的优缺点.对二者的选择取决于使用背景,学习花费和其它经常使用工具的须要 Martijn Theuwissen发表于DataCamp. 在DataCamp,学生经常问我们他们日常数据分析任务使用R或Python.尽管我们主要是提供交互式R教程,我们总是回答这个问题取决于他们所面对的数据分析挑战的类型. R和Python都是流行的统计编程语言.R的功能由统计学家开发(想想R强大的数据可视化

R电子书资料《学习R》+《R语言实战第2版》+《R数据科学》学习推荐

如果没有任何编程基础,想学习如何使用R,并进行练习,建议大家看看<学习R>电子书和代码资料,上半部分主要介绍R的技术细节和使用技巧,下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程. <学习R>电子书,帮助学习编写简单的R程序,知道R语言能做什么: 1.使用向量.数组.列表.数据框和字符串等数据类型 2.掌握条件语句以及分支和循环控制语句 3.应用R的扩展包,将你自己的工作成果打包发给其他人 4.清理从各种来源导入的数据 5.通过可视化和汇总统计理解数据 6.使

50个数据科学和机器学习速查表【转】

在数据科学领域有成千上万的包和数以百计的函数公式,你虽然不需要掌握所有的这些知识,但是有一个速查表在你的学习中是非常重要的.学习大数据包括对统计学.数学.编程知识(尤其是R.python.SQL)等知识的理解,还需要理解业务来驱动决策.这些表单也许能给你一些帮助. Python的速查表 Python在初学者中非常受欢迎,同样足以支持那些最受欢迎的产品和应用程序,它的设计让你在编程的时候感觉同用英语写作一样自然,Python basics 或者Python Debugger的速查表覆盖了重要的语法

利用Microsoft Azure Machine Learning Studio创建机器学习实例

Microsoft Azure云服务推出机器学习的模块,用户只需上传数据,利用机器学习模块提供的一些算法接口和R语言或别的语言接口,就能利用Microsoft Azure强大的云计算能力来实现自己的机器学习的任务. 本文浅尝了该机器学习模块,参照官方实例和帮助文档,完成了一个简单的应用实例,具体步骤如下. 1.新建workspace 注意,在填写workspace owner,一定要填写一个有效的windows live 账号 进入创建的workspace,界面如下图所示 2.上传数据 数据源:

使用Microsoft Azure Backup备份Hyper-V数据

在之前的文章中讲到了微软的云计算备份解决方案-Microsoft Azure Backup,通过技术可以备份Azure中的VM以及企业内部的Hyper-V.关于Microsoft Azure Backup可参见之前写的文章<Microsoft Azure Backup介绍>: http://ericxuting.blog.51cto.com/8995534/1641104 今天主要为大家带来如何通过Azure Backup备份企业内部Hyper-V数据.(PS:本文档基于国际版Azure,由世

Microsoft Azure News(1) 新的数据中心Japan East, Japan West and Brazil South

<Windows Azure Platform 系列文章目录> 微软官方博客今天表示,微软宣布将在日本东部(埼玉县)和日本西部(大阪)提供Windows Azure服务.就在最近,微软为Windows Azure推出了大规模的更新,大量新特性添加到云平台. Windows Azure也就是微软的云平台,通过该平台能够跨微软管辖的数据中心全球网络快速构建.部署和管理应用程序.可以使用任何语言构建应用程序.工具或框架,以及将其集成到现有的IT环境. 据微软称,在过去的几年日本的云市场增长迅速,20