大数据生涯感悟

  不知不觉,毕业一年半了,从实习开始接触大数据技术。那时懵懂的我,不对,应该说懵逼的我在想,卧槽,这是啥这么牛逼,我都不会啊。。。啥都不会完蛋了。。即便现在也是这样认为= =

  今年还是有很多变故的,不过丝毫无法阻挡我对技术的热情,这种热情犹如滔滔江水连绵不绝,哗啦啦啦啦啦啦~上图,让我们看下大数据工程师要掌握的技能有哪些呢?

  

  乍一看吓尿了。。等我洗个澡先。。。

  如果你愿意牺牲自己的所有时间去学习,研究,实践。我相信能够完全掌握里面的所有东西,只不过这是个漫长的过程。我觉得这张图还是很形象的,左边代表工程开发,右边代表算法开发。大公司基本分工非常明确。但在这个多元化的社会上,倘若你能掌握别人没有掌握,或者需要很高学习成本才能掌握的知识,那么你将会闪闪发光,犹如黑暗中的萤火虫,稻田里的金龟子~犹如太阳的光晕,犹如早起照射窗台的第一缕阳光,犹如~~好了好了。。我们回归正题。

  很多人说,这么多我勒个去,我不知道怎么学啊,从哪里开始啊。。那么我说下到现在为止,个人的学习之旅(仅个人):

  1、从2014年开始接触hadoop。。这是啥?买了本书(Hadoop Yarn权威指南)。。完全懵逼看不懂,但是坚持下来把它看完,然后开始搭建环境,单节点,当运行起来的一瞬间简直爽死我了~(注意,你要有Linux基础)

  2、开始看编程模型,MapReduce,MapReduce是啥。。好高大上啊,人总是对于未知的事物比较恐惧,可是恐惧也要看啊~看不懂也要看啊~搭开发环境,各种坑,我还没毕业好么,那么多工具,我怎么知道怎么用。。这报的啥错啊。。开始各种折腾。。

  3、产品经理说,我们要用spark!那是在2014年年底了,但其实最初调研的时候选用shark,因为那时候spark还没有商用,但最终还是用了spark,在决定之时突然spark1.3开始商用,加入DataFrame(当然那时候我是完全懵逼,这是啥?)。。受经理培养,我开始Spark之旅。那时对hadoop已经有了基本认知。

  4、进入2015年,项目已经开始进行spark开发,当然对于应用开发而言,完全从0开始,于是我们开始各种不要脸的去请教传说中的橘云分布式团队,我每次出差都买点东西孝敬他们老人家哈哈哈哈~~一点一点的学理论,一点一点的尝试,一点一点的问。这里要说下,做技术的,特别怕对方看不起自己,不敢问,怕被嘲笑。 其实真正热爱技术的,会对技术极度的热情,你要记住,丢人没有什么,再简单的学会了就是自己的了~于是开始买关于Spark的书,开始总结各种知识点,尝试,总结,尝试。

  5、2015年毕业前夕,第一次去湖北项目上线,将传统的应用系统改造为支持spark的大数据项目。对于我这种初出茅庐的小菜比而言,我勒个擦,真实集群,数据中心180多台的集群,批处理,流处理,看得我眼花缭乱,好害怕啊~~怕毛啊~直接就上了~部署各种调参数,出问题了甚至弄到晚上2点~北京的同事远程支持,各种前台后台的问题应接不暇,最终成功的上线~(这里有一点,搞技术的喜欢知根问底,在现场环境中,尤其是这种完全大数据环境,你要的就是不要脸的去问,一点不明白就问,这样收获的便是对整个大数据体系的流程与过程的熟知)

  6、2015年底,项目已经正常运行了一段时间了,在工作中不忘补习各种知识,完善知识体系,然后突然一个点,我似乎全通了。虽然这只是皮毛~慢慢的。。各个省市的上线,让我开始觉得就那些东西(这是危险的预兆)

  7、2016年初,由于某些原因,来到了上海某银行,这里是完全的大数据环境,当时其实有点害怕,为什么呢,因为虽然建立了大数据知识体系,但是实战经验还是不足而我更多的是做spark,二话不说直接上手操练,各种折磨的每天12点以后还亮着灯。学习hbase,redis,storm,kafka以及更深入hadoop。。有时甚至有放弃的想法,在巨大的压力下,每天顶着红牛,学,练习,学,练习。

  8、如今,某个时刻,突然又一次觉得,貌似我全都会了!仿佛脑海中能够感受到数据在各个组件中的传输,网络中的传输,什么时候会OOM,JVM占用,网络通信。。。也再一次开始应用spark,这一次,让我激动地每天激情四射,为什么呢?因为我发现曾经很多不懂的知识点,貌似全通了。。在寂静的夜晚,想着身边离开的人,默默地留下了眼泪,你怎么不等我。

  总结:技术,是在不断地更新迭代,但是一定要有一套自己的知识体系,自己的理解,千万不要认为啊~我会写这个MapReduce了,我会写spark后台代码了,我会用hbase了,我会storm了,就沾沾自喜,看的更远一点更深一点,你会发现,原来我啥都不会,学无止境! 坚持!坚持!坚持!坚持!再坚持!用你坚韧的毅力与激情,感染身边的人,影响身边的人。

时间: 2024-12-19 15:32:36

大数据生涯感悟的相关文章

CSDN专访:大数据时代下的商业存储

原文地址:http://www.csdn.net/article/2014-06-03/2820044-cloud-emc-hadoop 摘要:EMC公司作为全球信息存储及管理产品方面的领先公司,不久前,EMC宣布收购DSSD加强和巩固了其在行业内的领导地位,日前我们有幸采访到EMC中国的张安站,他就大数据.商业存储.Spark等给大家分享了自己的看法. 谈到大数据,张安站认为大数据本质上是两个根本性的问题,一个是数据很大,如何存储?另外一个是数据很大,如何分析?第一个问题,对于存储厂商来说,就

行在说 | 从阿里巴巴大数据之路看企业中台战略

戳右方链接观看精彩视频从阿里巴巴大数据之路看企业中台战略 视频导读: 提到阿里巴巴,我们首先想到的是一家电商互联网企业,淘宝.天猫.支付宝等一系列平台和产品已经彻底改变了我们的生活.当大数据开启一个时代时,拥有海量交易数据的阿里巴巴就已经认识到这是一座大的金矿,并在众多的电商企业中率先开始了淘金之旅,大数据平台也在其中扮演了非常重要的角色. 本视频是行在(奇点云创始人兼CEO)关于<从阿里巴巴大数据之路看企业中台战略>的分享.他以亲身经历讲述了阿里大数据的演变,大数据部门从组织架构到系统架构所

大数据售前的一点感悟

自从去年转互联网以来,发现节奏明显比传统行业要快许多.以前还经常写一些工作上的感悟,而现在,基本上都是被工作内容所填充.从APM到大数据,互联网里边技术分支也有很多,工作内容也有不同.不过都是从事售前工作,主要客户对象也还是传统政企客户.断断续续总结了一些心得,分享出来.希望能够指引那些同样在售前的兄弟们....... (一) 售前感悟:若要成长,就要多跟客户在一起,学习客户的业务,学习他们对技术的诉求点,而不要沉浸在自我的技术满足之中.更何况:对于相对复杂点的技术(比如大数据,云,AI等等),

阿里开发者们的第15个感悟:做一款优秀大数据引擎,要找准重点解决的业务场景

1月10日,做一款优秀大数据引擎,要找准重点解决的业务场景.这是我们送给开发者的第15个感悟. 沐远在社区分享了他的博文,<使用spark分析云HBase的数据><hive数据导入云hbase>,粉丝评论说请收下我的膝盖. 李伟(沐远)阿里云数据库技术专家专注大数据分布式计算数据库领域, 研发Spark及自主研发内存计算,目前为广大公有云用户提供专业的云HBase数据库及计算服务. 做一款优秀大数据引擎,要找准重点解决的业务场景,打磨一套易用的API,构架与上下游联动的生态. 推荐

大数据学习之_01_Linux学习_02_组管理和权限管理+定时任务调度+linux磁盘分区、挂载+linux的网络配置+进程管理(重点)+软件包管理+大厂面试题+感悟分享+资料附录

10 组管理和权限管理10.1 Linux组的基本介绍10.2 文件/目录的所有者10.3 文件/目录的所在组10.4 权限的基本介绍10.5 rwx权限详解10.6 修改权限指令-chmod10.7 修改文件所有者-chown10.8 修改文件所在组-chgrp10.9 最佳实践-警察和土匪游戏11 定时任务调度11.1 crond任务调度12 linux磁盘分区.挂载12.1 分区的基本知识12.2 Linux分区12.3 挂载的经典案例12.4 查询系统整体磁盘使用情况12.5 查询指定目

【51CTO学院三周年】大数据,让我找到了继续努力的方向

时间都去哪了? --记我将要到来的工作四周年 不知不觉间,工作马上就要满四周年了.从初出校门的楞小伙,变成了人夫,也即将成为人父,总是会感叹,"时间都去哪了?" 还记得刚工作那时,每天上班都很煎熬,领导分配的工作,很多东西都不会,需要请教项目组的其他同事,有时候,老是请教别人觉得很简单的问题,也会让自己觉得很脸红.所以,自己就告诉自己,一定要自己好好努力,多学习,多看书.慢慢的,买的书越来越多,会的东西也也来越多了.从每天写代码的小弟,也转变成了管理和写代码兼顾的项目经理. 虽然现在工

我的ElasticSearch集群部署总结--大数据搜索引擎你不得不知

摘要:世上有三类书籍:1.介绍知识,2.阐述理论,3.工具书:世间也存在两类知识:1.技术,2.思想.以下是我在部署ElasticSearch集群时的经验总结,它们大体属于第一类知识“techknowledge(技术)”.但其中也穿插一些我个人的理解.敬请指正. 关键词:ElasticSearch, 搜索引擎, 集群, 大数据, Solr, 大数据 三类书籍 和 两类知识: 有一些书是对某一新知识领域的介绍,将此知识领域从头到尾.从内而外剖开了分析,吸收这些知识主要在于“记忆”,(也有“领会”)

大数据策略出自生存危机

adMarketplace网站是一家搜索联盟和广告平台提供商,在失去了eBay这一坚强后盾之后,他们抓住了大数据这棵救命稻草.重建后的adMarketplace终于逆流而上,成功扩张了它的互联网领地. 所谓搜索联盟,就是根据网站搜索情况,针对潜在客户投放相关广告的模式.adMarketplace的系统经大数据机器支持,浴火重生,赢得了诸如索尼.沃尔玛和GM这样的巨头客户.不仅如此,正因为网站的大数据策略,公司才能够在今年的Constellation SuperNova大奖中争取到半决赛的席位:该

推荐文章:机器学习:“一文读懂机器学习,大数据/自然语言处理/算法全有了

PS:文章主要转载自CSDN大神"黑夜路人"的文章:          http://blog.csdn.NET/heiyeshuwu/article/details/43483655      本文主要对机器学习进行科普,包括机器学习的定义.范围.方法,包括机器学习的研究领域:模式识别.计算机视觉.语音识别.自然语言处理.统计学习和数据挖掘.这是一篇非常好的文章,尤其感学原文作者~          http://www.thebigdata.cn/JieJueFangAn/1308