从机器学习到学习的机器,数据分析算法也需要好管家

(上图为IBM大数据与分析事业部全球研发副总裁Dinesh Nirmal)

今年是莎士比亚逝世四百周年。在莎翁名剧《尤利乌斯·凯撒》中一个占卜师有这样一句没有上下文的预言:“请小心‘三月’中”, 凯撒听后不知道这句话是何意思,于是说让这个占卜师继续做梦吧。结果在三月十五日,凯撒被密谋暗杀。类似的,今天的预测算法可以告诉你一个预言,但却无法提供合适的上下文,这让人难以做出进一步行动的决策。

另一个关于预测算法的例子是在最新的《复仇者联盟3》中,出现了一个人工智能合成物“奥创”。奥创只能按字面理解任务,于是把“拯救地球”理解成了“杀死所有的人类”。这就像一个典型的预测算法,按字面理解任务而忽略掉了其它的可能性或任务的现实意义。

于是,2016年1月,哈佛商学院教授Michael Luca、经济学教授Sendhil Mullainathan以及康奈尔大学教授Jon Kleinberg联合在《哈佛商业评论》发表了一篇题为《算法也需要管家》的文章,呼吁全球科技界和商界在机器学习算法和人工智能时代要注意算法的管理问题。因为,如果有一天,算法能够决定“凯撒”或地球的命运,那么谁来管理算法呢?

IBM大数据与分析事业部全球研发副总裁Dinesh Nirmal最近现身在北京举办的2016机器学习和行业应用国际峰会,他介绍了IBM作为全球大数据分析、机器学习和人工智能的前沿科技企业将如何面对一个复杂的算法世界,这就为机器学习造一个可以自学习、自调整、自优化的机器管家——基于Spark的机器学习云服务。

Apache Spark是一个分布式计算框架,是专为满足低延迟任务和内存数据存储而优化的开源大数据系统。由于其并行计算性能以及兼顾速度、可扩展性、内存处理以及容错性等,再加上可大幅简化编程的丰富API,让Spark成为了机器学习算法的主流计算平台。IBM在2015年6月宣布加入Spark开源社区,并承诺将把Spark作为自己的分析与商务平台核心。

2016年6月开始,IBM花了5个月时间开发了基于Spark的机器学习云服务,该云服务将提供公有云、本地部署及混合云部署等版本,该云服务还可部署在IBM大型主机z系列上。Dinesh强调,该云服务除了在获取数据、抽取特征、训练模型、部署模型、做出预测等经典机器学习过程中进行优化外,还加入了持续反馈、自动建模、重新训练模型等自动化管理。

在自动建模中,IBM的机器学习云服务能够根据数据模型自动推荐最优算法,并根据数据特征值来评价模型的性能和表现,当模型训练好后可在实时环境、生产环境和离线批量环境中部署模型。当数据变化后,该云服务还能实时监控模型的表现,然后自动重新训练模型。整个过程中不需要把模型离线训练后再重新上线,极大方便了实时生产环境中的商业应用。

Dinesh认为,在机器学习的世界里,开源是一个大趋势。为此,IBM开源了自己的重量级机器学习框架SystemML,并在旧金山设立Spark技术中心,还在全球投入超过3500名IBM研究和开发人员开展与Spark相关项目。2016年6月,IBM把自己的开源软件与基于Apache Spark的H2O、RStudio、Jupyter Notebooks等开源科研分析交互环境相结合推出了Data Science Experience云服务,以提升数据科学家的机器学习和数据分析速度。

为了进一步加强自己的数据分析产品和技术生态圈,IBM从2015以来为Apache Toree、EclairJS、Apache Quarks、Apache Mesos、Apache Tachyon(现更名为Alluxio)等开源项目做了大量贡献,也为Apache Spark的子项目如SparkSQL、SparkR、MLLib和PySpark等做了深入贡献。如今,Spark已经与IBM的Watson、商务、分析、系统和云等超过45种核心产品相结合。

IBM对于Spark的投入已经超过3亿美金,并把Spark视为数据分析的操作系统。推出基于Spark的机器学习云服务是IBM的最新进展,是为了给机器学习算法提供一个安全、高可靠的统一管理平台。在此基础之上,IBM进一步把Watson用于机器学习,让人工智能帮助机器学习算法更“聪明”地理解人的意图,这就是刚推出的Watson数据平台。

Dinesh介绍说IBM正在把所有的机器学习、人工智能、数据分析、数据管理等整合起来到一个统一的基于Spark的平台上,这包括开源的算法以及IBM自有的算法等,再经过优化和配备企业级解决方案,最终以混合云方式为企业打造一个可以自由选择的数据与算法管理平台。

2017年,我们将迎来一个移动互联网大发展的大时代,数据与算法将更加容易地“统治”世界。从在线音乐、在线游戏、在线广告到各类生活服务、社交沟通以及内容消费等,机器学习算法在不知不觉中替人们做了很多选择。因此在欢呼机器解放人类的同时,也要警惕算法带来的“偏见”,这就需要能够自学习、自校正的机器。

从机器学习到学习的机器,这是人工智能商业化道路上的必经之路。(文/宁川,微信号:CloudTechTime)

时间: 2024-10-12 22:22:14

从机器学习到学习的机器,数据分析算法也需要好管家的相关文章

机器学习基石笔记9——机器可以怎样学习(1)

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习基石笔记10——机器可以怎样学习(2)

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习&深度学习基础(tensorflow版本实现的算法概述0)

tensorflow集成和实现了各种机器学习基础的算法,可以直接调用. 监督学习 1)决策树(Decision Tree) 决策树是一种树形结构,为人们提供决策依据,决策树可以用来回答yes和no问题,它通过树形结构将各种情况组合都表示出来,每个分支表示一次选择(选择yes还是no),直到所有选择都进行完毕,最终给出正确答案. 决策树(decision tree)是一个树结构(可以是二叉树或非二叉树).在实际构造决策树时,通常要进行剪枝,这时为了处理由于数据中的噪声和离群点导致的过分拟合问题.剪

【推荐算法工程师技术栈系列】机器学习深度学习--强化学习

目录 强化学习基本要素 马尔科夫决策过程 策略学习(Policy Learning) 时序差分方法(TD method) Q-Learning算法 Actor-Critic方法 DQN DDPG 推荐系统强化学习建模 附录 强化学习基本要素 智能体(agent):与环境交互,负责执行动作的主体: 环境(Environment):可以分为完全可观测环境(Fully Observable Environment)和部分可观测环境(Partially Observable Environment).

推荐文章:机器学习:“一文读懂机器学习,大数据/自然语言处理/算法全有了

PS:文章主要转载自CSDN大神"黑夜路人"的文章:          http://blog.csdn.NET/heiyeshuwu/article/details/43483655      本文主要对机器学习进行科普,包括机器学习的定义.范围.方法,包括机器学习的研究领域:模式识别.计算机视觉.语音识别.自然语言处理.统计学习和数据挖掘.这是一篇非常好的文章,尤其感学原文作者~          http://www.thebigdata.cn/JieJueFangAn/1308

一文读懂机器学习,大数据/自然语言处理/算法全有了……

原文地址 http://www.open-open.com/lib/view/open1420615208000.html http://www.cnblogs.com/subconscious/p/4107357.html 引论 在本篇文章中,我将对机器学习做个概要的介绍.本文的目的是能让即便全然不了解机器学习的人也能了解机器学习.而且上手相关的实践.这篇文档也算是 EasyPR开发的番外篇.从这里開始.必须对机器学习了解才干进一步介绍EasyPR的内核.当然,本文也面对一般读者.不会对阅读有

机器学习&深度学习资料分享

感谢:https://github.com/ty4z2008/Qix/blob/master/dl.md <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost 到随机森林.Deep Learning. <Deep Learning in Neural Networks: An Overview> 介绍:这是瑞士人工智能实验室 Jurgen Schmidhuber

【转】近200篇机器学习&amp;深度学习资料分享(含各种文档,视频,源码等)

编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等.而且原文也会不定期的更新,望看到文章的朋友能够学到更多. <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机.神经网络.决策树.SVM.Adaboost 到随机森林.Deep Learning. <Deep Learning in Neural Networks: An Overview> 介绍:这是瑞士人工智能实验室 Ju

[转载]机器学习&amp;深度学习经典资料汇总,全到让人震惊

自学成才秘籍!机器学习&深度学习经典资料汇总 转自:中国大数据: http://www.thebigdata.cn/JiShuBoKe/13299.html [日期:2015-01-27] 来源:亚马逊  作者: [字体:大 中 小] 小编都深深的震惊了,到底是谁那么好整理了那么多干货性的书籍.小编对此人表示崇高的敬意,小编不是文章的生产者,只是文章的搬运工. <Brief History of Machine Learning> 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感