2014年大数据年终工作总结

2014年大数据年终工作总结

今天是圣诞节,2014年马上要过去了。回顾这一年在大数据研发上的点点滴滴,总结如下三个方面:

一、大数据研发技术路线

目前,存在太多的大数据技术,商业软件,如Teradata、Oracle、SAP、IBM等。开源的,如Hadoop、Spark、MPP DB、NewSQL等。在大数据领域,Hadoop呈一支独大势。经过这段时间的学习和了解,发现Hadoop技术复杂,架构复杂,社区版成熟度可能也就80%左右。要想把Hadoop玩转起来,可能需要投入巨大的成本来完善。Cloudera的

CDH也仅是增强了稳定性和易用性,还远未达到商业软件可靠性和易用性的程度。

公司选择了与Cloudera合作的战略,这点在国内市场上还前途未卜。Spark在快速升级,增加了很多功能,性能也有很大提升,但实际使用还很少。Cloudera对Spark支持也

很有限,定位也很模糊。这可能是因为和自己的Impala功能上有冲突所致。前段时间介绍了朋友的MPP DB技术,公司对此兴趣不大,可能是因为朋友公司知名度还不够吧。

目前,国内的情况是客户对大数据看好,但创新意识程度不够,乙方在强打大数据牌,但缺乏实际项目经验,而大数据的现状决定了必须在实际项目中优化才能在生产中使用。也就是说,大数据不单是个研发项目,更是个研发+运维的持续优化过程。而这点,恰是乙方传统的项目管理方式所缺乏的。

二、大数据研发的创新所在

国内的公司纷纷打出大数据产品的旗号,往往浪费了人力、物力却收获甚微。为什么呢?一个很大的原因是好高骛远所致。搞技术不是做咨询、也不是做售前,需要积累、沉淀和创新,而这些绝非一蹴而就。目前,在国人的拿来主义驱使下,大数据的基础架构这块基本没有创新能力,也没有创新动力。做这块,基本是举步维艰。如果真要做的话,我觉得在大数据基础架构这块可以关注Julia+GPU+分布式这块。

目前,在大数据上层应用来说,数据集成、数据建模和挖掘建模还几乎是空白。在可视化上,还大有可为。但这块传统上是国外厂商的强项,也不看好这块。

除此之外,能够出彩的地方就是大数据行业应用了。朋友做过移动基于信令的小区热点分析和交通拥堵分析,确实做到了过去想做所未能做到的。这点,确实是个极大的进步。这还只是大数据的统计查询而已,对大数据的挖掘才能体现出大数据的价值。在大数据挖掘上,期待能有更好的工具软件和行业热点你出现。

三、个人关注的领域

目前,工作上更多的是电信行业的大数据应用。个人更关注大数据在企业中的应用,并着力推进这方面的应用。现在正和朋友策划用大数据技术来代替SAP HANA,以实现企业数据仓库/BI的数据统计查询功能。

以上是本人在2014年的年终总结。希望用大数据技术代替HANA的构想在2015年能够实现,并获得极大的成功。也希望2015年能在移动大数据应用上能有所突破。在此与各位在2015年共勉!

时间: 2024-10-10 22:54:56

2014年大数据年终工作总结的相关文章

谈谈ODPS商业化(四):2014阿里巴巴大数据竞赛

几天前2014阿里巴巴大数据竞赛刚刚落下帷幕,第11名的F1分数.准确率和召回率是6.10%.6.28%和5.93%.前10名的成绩还未公布,他们会被邀请到阿里巴巴公司来,有机会和内部团队一起参与双11.选手们闲下来,开始在群里爆特征.开玩笑.交换联系方式. 这次海内外共有7276支队报名.比赛分为多个阶段:S1是线下海选,从S2开始上ODPS,每月底淘汰末位的100支队,直到7月31日尘埃落定.选手们需要像阿里数据分析师一样工作,完全依赖云端的ODPS平台上的SQL.Mapreduce和Xli

Hadoop大数据高薪工作经验分享

分享超人学院90后小伙,Hadoop大数据高薪工作经验分享 http://pan.baidu.com/play/video#video/path=%2F%E5%A4%A7%E6%95%B0%E6%8D%AE%2F%E8%B6%85%E4%BA%BA%E5%AD%A6%E9%99%A2%E9%AB%98%E8%96%AA%E5%B0%B1%E4%B8%9A%E8%A7%86%E9%A2%91%E5%88%86%E4%BA%AB%2F90%E5%90%8EHadoop%E5%B7%A5%E4%BD%

2014中国大数据大会专题报道

摘要:有人推崇产品,有人推崇运营,也有人推崇战略-到底该推崇什么?李智勇系统地分析了这三者之间的思路,并引用黑格尔的一句话,给出了自己的看法:在尺度中已经蕴含本质,这在产品.运营.战略的侧重上体现的非常好. 视野不拉升或者认知不深入时,就容易在盲人摸象层面上反复,看到微信火了,那就产品最重要,看到阿里火了,那就平台最重要.实际上一个比较显然的事实是,没有锥子一样的产品,那你就火不起来:不能从产品升级为平台,那就很可能活不下去.当然,有些人会说平台也是一种产品,但就和人与猴子都是灵长目,实际上仍是

LinkedIn高级分析师王益:大数据时代的理想主义和现实主义(图灵访谈)

转自:http://www.ituring.com.cn/article/75445 王益,LinkedIn高级分析师.他曾在腾讯担任广告算法和策略的技术总监,在此期间他发明了并行机器学习系统“孔雀”,它可以从数十亿的用户行为或文本数据中学习到上百万的潜在主题,该系统被应用在腾讯可计算广告业务中.在此之前,他在Google担任软件工程师,并开发了一个分布式机器学习工具,这个工具让他获得了2008年的“Google APAC 创新奖”.王益曾在清华大学和香港城市大学学习,并取得了清华大学机器学习和

chinacloud大数据新闻

2015年大数据发展八大趋势   (0 篇回复) “数据很丰满,信息很骨感”:Sight Machine想用大数据的方法,打碎两者间的屏障   (0 篇回复) 百度携大数据"圈地"证券业 "BAT"开启互联网金融新战场   (0 篇回复) 码农的春天到了?   (0 篇回复) 浪潮大数据一体机出招 装备科研“最强大脑”   (0 篇回复) 方物软件承担国家“核高基”重大专项研发   (2 篇回复) 2013互联网大会透露的热点与新趋势   (1 篇回复) 大数据从幕

各地都在搞大数据,你的家乡有啥特色没——解读2017年地方政府大数据报告

文 | 帆软数据应用研究院 水手哥 日前,数据中心联盟大数据发展促进委员会发布了<我国地方政府大数据发展规划分析报告>,聚焦各省市大数据发展举措,对37个省市的大数据文件展开了整理,从目标定位.基础能力.应用.产业.安全保障等规划进行了总结分析,可以帮助大家比较全面的了解地方大数据发展政策. 一.不同的特色 整体来看,各地政府依据自身实际情况,形成了以下三种发展规划: 1.引领型.以北京.广东.江苏为代表,这三地凭借强大的经济.科技与人力资源实力,在关键技术.先进产品.产业生态体系构建方面,制

大数据正在改变企业信息化

2014年8月17日受邀参加由武汉市人民政府.武汉大学和FFC共同举办的大数据与未来计算论坛,专家云集,激烈的头脑风暴,让人受益匪浅,但个人还是有点担忧,或许骨子里的愤青基因在作弄,我不得不发泄一下,尽管我特别地尊重教授专家们,但中国太多的跟风造势了,喜欢口号,喜欢空谈,近几年来云计算.移动互联网等新概念新玩意层出不穷口沫纷飞浩浩荡荡,虽然也有很多成功的应用和企业,但我们仍然大多是在模仿和追赶,我们的创新我们的核心在哪里?80%以上的手机还不都是在用IOS和ANDROID系统吗?你牛逼你整一个出

大数据要少说多做

与云计算当初遇到的问题一样,大数据也面临如何"做实"的问题.在已经认识到大数据的重要性和必要性的基础上,企业要做的是更"智慧"地处理大数据,在大数据的应用和商业模式上进行创新. 8月22-24日,2014中国大数据国际高峰论坛在上海举行.记者随机采访了几位与会嘉宾,他们几乎异口同声地表示:大数据当前最紧迫的任务是加速落地,不能光讲概念,关键还是利用大数据为业务服务,促进应用创新. 不要太浮躁 "浮躁",这是天云大数据首席执行官雷涛对当前中国大数据

大数据:未来的新石油?

从海量数据中"提纯"出有用的信息,这对网络架构和数据处理能力而言也是巨大的挑战.   如果你是<老友记>的粉丝,你一定不会忘记钱德勒.剧中,他总是不断地向人们解释自己的工作,似乎别人永远也搞不懂他所谓的"统计分析和数据修复专员"是做什么的? 这不能怪钱德勒,10年前,在<老友记>热播时,要向一个陌生人解释这个与数据统计分析相关的岗位确非易事.不过到了今天,钱德勒的工作却变得炙手可热. 隐形的金矿 在经历了几年的批判.质疑.讨论.炒作之后,大数