2015 Spark 将走向哪里?

在刚刚过去的spark submit上,Matei Zahara简单回顾了下2014年spark的发展,可用一个词来概括那就是"Amazing"!!!

那么2015年,spark 将主要精力放在哪些方面呢?

一个是数据科学,即提供更高级的API接口,使得用户更易上手,像在单台机器上使用。主要的改变是:1.提供DataFrame(此已在1.3版本中看到了)2. 机器学习pipeline化 3. 增加R接口(大概在6月份1.4版中出现)

二是提供更多的数据源接口和packages。

时间: 2024-10-06 01:19:41

2015 Spark 将走向哪里?的相关文章

黄洁:Intel Spark应用优化和实践经验

摘要:黄洁就Spark的内存管理.IO提升和计算优化3个方面进行了详细讲解.黄洁表示,对比MapReduce,Spark擅长于复杂的机器学和图的计算.流处理等多种业务场景. [编者按]干货满满的2015 OpenStack技术大会.2015 Spark技术峰会.2015 Container技术峰会以实力赢得所有观众的认可.在Spark峰会上,英特尔大数据技术中心研发经理黄洁就Spark的内存管理.IO提升和计算优化3个方面进行了详细讲解,以下为演讲概述. 下为演讲概述 我来自Intel大数据技术

平易近人、兼容并蓄——Spark SQL 1.3.0概览

摘要:DataFrame API的引入一改RDD API高冷的FP姿态,令Spark变得更加平易近人.外部数据源API体现出的则是兼容并蓄,Spark SQL多元一体的结构化数据处理能力正在逐渐释放. 关于作者:连城,Databricks工程师,Spark committer,Spark SQL主要开发者之一.在4月18日召开的 2015 Spark技术峰会上,连城将做名为"四两拨千斤--Spark SQL结构化数据分析"的主题演讲. 自2013年3月面世以来,Spark SQL已经成

阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点

笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapReduce Job 做 ETL ,用 Hive 做 Ad hocquery,用 Tableau 做数据可视化,用 R 做数据分析).今天我想借此机会和大家聊聊我所理解的大数据现状和未来. 首先让我们来聊聊什么是大数据.大数据这个概念已经出来很多年了(超过10年),但一直没有一个准确的定义(也许也

深度学习 vs 机器学习 vs 模式识别

整理:深度学习 vs 机器学习 vs 模式识别 发表于2015-03-24 22:58| 78882次阅读| 来源个人博客| 41 条评论| 作者Tomasz Malisiewicz 模式识别深度学习机器学习数据科学家 摘要:本文我们来关注下三个非常相关的概念(深度学习.机器学习和模式识别),以及他们与2015年最热门的科技主题(机器人和人工智能)的联系,让你更好的理解计算机视觉,同时直观认识机器学习的缓慢发展过程. [编者按]本文来自CMU的博士,MIT的博士后,vision.ai的联合创始人

微博电商VS微信电商 同质化下的差异竞争

近日,新浪微博主导的微电商峰会透露,微博将联合阿里.微卖等第三方合作伙伴,共建以兴趣为导向的移动社交电商平台,试图抄底微信电商.微博电商VS微信电商,你更看好哪一个? 文/张书乐 刊载于<销售与市场>杂志管理版2015年09期 7月7日,由新浪微博主导的微电商峰会召开,此次会议透露,微博将联合阿里.微卖等第三方重点合作伙伴,共建以兴趣为导向的移动社交电商平台. 为了给此次全新亮相站台,微博CEO王高飞甚至在会议上喊出了"请忘记自己是社交产品"的雷人之语,并标榜称:"

【问底】夏俊:深入站点服务端技术(一)——站点并发的问题

url=http%3A%2F%2Fwww.csdn.net%2Farticle%2F2015-03-16%2F2824221&type=3&count=&appkey=&title=%E6%9C%AC%E6%96%87%E6%9D%A5%E8%87%AA%E6%8B%A5%E6%9C%89%E5%8D%81%E5%B9%B4IT%E4%BB%8E%E4%B8%9A%E7%BB%8F%E9%AA%8C%E3%80%81%E6%93%85%E9%95%BF%E7%BD%91%E

linux文件系统及文件系统类型

Linux的文件系统,根文件系统(rootfs):root filesystem.LSB, FHS: (FileSystem Heirache Standard) [[email protected] ~]# ls / bin   data  etc   lib    lost+found  mnt  proc  sbin     srv  tmp  var boot  dev   home  lib64  media       opt  root  selinux  sys  usr /bo

【问底】夏俊:深入网站服务端技术(一)——网站并发的问题

摘要:本文来自拥有十年IT从业经验.擅长网站架构设计.Web前端技术以及Java企业级开发的夏俊,此文也是<关于大型网站技术演进的思考>系列文章的最新出炉内容,首发于CSDN,各位技术人员不容错过. 注:本文首发于CSDN,转载请标明出处. [编者按] 本文来自拥有十年IT从业经验.擅长网站架构设计.Web前端技术以及Java企业级开发的夏俊,此文也是<关于大型网站技术演进的思考>系列文章的最新出炉内容,首发于CSDN,各位技术人员不容错过. 以下为正文: 一. 引子 <关于

Cgroup maintainer李泽帆:解剖Linux内核容器技术

摘要:Cgroup和namespace等内核特性如何出现,在社区处于怎样的开发状况?Docker如火如荼,内核社区是否会因此加紧完善容器技术的隔离性安全性?华为Linux内核高级工程师李泽帆将在2015 Container技术峰会上详细解说. 2015年4月16-18日,由CSDN主办.CSDN专家顾问团支持的OpenCloud 2015大会将在北京国家会议中心拉开帷幕.为期三天的大会,以推进行业应用中的云计算核心技术发展为主旨,聚焦技术创新与应用实践,设置了"2015 OpenStack技术大