大数据微职位学习心得

写了几年代码,看到这些年大数据,AI闹得火热火热,也想系统学习下大数据方面的东西,给自己充电一下。其实随着IT技术的发展,我们行业(地理信息)也已经开始拥抱大数据了。越来越多的带有位置的非结构化的数据需要处理,需要进一步挖掘。好了,废话不多说了。下面开始分享下,学习大数据这门过程中的一些心得。
其实,大数据这门课,学起来还是得要有些知识储备的,比如最基本的linux操作,以及操作hive以及mysql的一些语句(如果懂关系型数据库里的sql,那操作起这些语句就简单了),Python的一些东西,如果有些开发经验就更完美了。
在学习这门课的时候,最开始基于linux上的一些操作,以及后来的搭建集群倒是没得啥问题。可是到后来安装cloudera-manager的时候,发现master节点上的agent,server-db都起来了,server服务起不来,这时候就得去看相应路径下的日志啊,发现提示是缺包(红框是根据日志找到的缺的包,但是事实不止缺这么几个,其他的几个都补上了):

想着这样不是办法,怕后续还会出啥问题,然后就拉着导师一起看,看了好久发现是cloudera manager的版本与linux版本不匹配导致的,后来一查我的系统是centos6.9的。下图是在cloudera官网找到的cloudera manager 5.11版本与操作系统兼容的情况,当时我的linux系统是6.5的,应该是做了update没注意到,update到6.9的版本了,可是呢官网给出的6.9版本的CentOS是不兼容cloudera manager 5.11安装的。所以说学习一项东西看官网是很重要的,你想想东西都是出自他那里,外面的中文的帮助书籍无非就是从人家的官网翻译一下而已。

还有一点,出了问题时,不要怕,要学会去解决问题。比如在学hive,hbase,以及spark的时候,很多时候你执行操作的命令行,在出错时终端会有相应的日志,可以从日志里去捕捉导致异常的原因。以下是我在执行连接hive时:beeline -u jdbc:hive2://elephant:10000 出现的异常

就可以通过这些日志在网上查一下,百度不行就去谷歌。这个日志异常主要说的就是Name Node处于安全模式,不能产生/tmp/hive/hive/1074c23d-d039-4741-a6db-4d19adf4673f这个路径,在网上查一下就会有相应的解决方案的。最反感的是一出问题就到处找人解决,首先自己得去分析下,去网上找下资料,实在不行的可以再请教别人。试想一下,本来问题很简单,没看就问别人,别人一看就指出了原因,岂不让别人觉得自己很low?

最后我觉得,在学习时还是有必要根据老师讲的来捋一下相应的流程,提炼出一些导图啥的(思维导图工具:xmind,mindmanager都不错),这个确实对学习技术很有帮助,这个不管对学习哪一门技术都有用。其实看大家说HBASE讲的都是理论,话说理论掌握了,操作应该没什么问题吧?反之,只会跟着老师敲一些命令,具体的里面含义不懂,这对于学技术是没有什么意义的。



 

原文地址:http://blog.51cto.com/6193721/2058972

时间: 2024-08-30 12:13:56

大数据微职位学习心得的相关文章

大数据微职位学习心得分享

大数据学习可以基本分为六大模块:一.linux1.Linux基础和分布式集群技术学完此阶段可掌握的核心能力:熟练使用Linux,熟练安装Linux上的软件,了解熟悉负载均衡.高可靠等集群相关概念,搭建互联网高并发.高可靠的服务架构:学完此阶段可解决的现实问题:搭建负载均衡.高可靠的服务器集群,可以增大网站的并发访问量,保证服务不间断地对外服务:学完此阶段可拥有的市场价值:具备初级程序员必要具备的Linux服务器运维能力.1.内容介绍:在大数据领域,使用最多的操作系统就是Linux系列,并且几乎都

大数据分析师和大数据工程师职位,孰轻孰重(个人角度)

在互联网盛行的今天,能够预测未来需要依靠更多数据支持,从数据的趋势和分析中,就可以把未来的发展动向掌握得淋漓尽致.在大数据背景之下,精通大数据的专业人才将成为企业最重要的业务角色,大数据从业人员薪酬持续增长,人才缺口巨大. 最近在回答粉丝问题中,我发现一个问题:很多人对于大数据的职位体系不了解,一些对于想入门与大数据的人一直处于迷茫阶段,不知道自己该不该转行学习大数据,不知道自己是否要转大数据专业,这里就给大家分析一下( 个人观点) 数据分析师指的是不同行业中,专门从事行业数据搜集.整理.分析,

需要同时掌握AVA和Linux,才可以继续大数据课程的学习

大数据包含的技术知识很多,如果是从头学起,一般是从两个方面入手,一是基础:二是专业技能.下面我们不妨从这两个方面给出一个简单的学习过程.希望对你有所帮助. 一.基础 学习大数据的两大基础就是JAVA和Linux,学习顺序不分前后.需要同时掌握,才可以继续大数据课程的学习. 在这里小编建了一个大数据学习交流扣扣群:529867072,我自己整理的最新的大数据进阶资料和高级开发教程,如果有想需要的,可以加群一起学习交流 Java:大家都知道Java的方向有JavaSE.JavaEE.JavaME,学

零基础如何转行大数据?系统学习路线在此

都知道大数据薪资高,前景好.而大数据又需要Java基础.对于稍微懂些Java的童鞋来说,到底如何转行大数据呢?今天小编给你一个大数据工程师具体的学习路线图.[ps:无java基础也可以学习大数据] 分享转行经验路线 对于Java程序员,大数据的主流平台hadoop是基于Java开发的,所以Java程序员往大数据开发方向转行从语言环境上更为顺畅,另外很多基于大数据的应用框架也是Java的,所以在很多大数据项目里掌握Java语言是有一定优势的. 在这里还是要推荐下我自己建的大数据学习交流群:5298

了解大数据,才能更好地学习大数据(附学习路线)

其实简单的来说,大数据就是通过分析和挖掘全量的非抽样的数据辅助决策. 大数据可以实现的应用可以概括为两个方向,一个是精准化定制,第二个是预测.比如像通过搜索引擎搜索同样的内容,每个人的结果却是大不相同的.再比如精准营销.百度的推广.淘宝的喜欢推荐,或者你到了一个地方,自动给你推荐周边的消费设施等等. 随着大数据行业的快速发展,也随之出现了一些问题,比如大数据人才的缺失就是目前急需解决的一个问题,那么很多学大数据的人又出现了一些问题,就是大家普遍担心的就是零基础能不能学习大数据,会不会不好学? 零

大数据工程师微职位学习分享

随着各行各业的数据量快速增长,无论是从对数据的存储.分析.处理和挖掘等方面提出了越来越高的要求.IT行业正在逐渐向"DT"行业转变,未来是以数据为驱动的.所以我认为大数据是未来一个主流方向,了解和学习大数据对我们以后的工作和生活都有一定帮助. 近期我个人学习了大数据工程师微职位这门课,并且已经通过了所有的考核.下面切入正题,分享一下我的学习心得,因为篇幅关系,不涉及具体知识点. 因为这门课是偏大数据分析的,基本上不涉及大数据组件的开发,所以这门课撇开了冗长的java课程.另外,因为涉及

到底什么是大数据?新手学习大数据的路径是什么?

大数据具体是什么意思?虽然都知道高薪,但如何学习大数据呢?有哪些学习路径和方法?今天我们就来具体看一下 大数据是什么? 来看看维基百科的定义 大数据(英语:Big data或Megadata),或称巨量数据.海量数据.大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取.管理.处理.并整理成为人类所能解读的信息. 在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合并后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势.判定研究质量.避免疾病扩

2015年获得大数据顶尖职位必备的9项技能

  在大数据商品化之前, 利用大数据分析工具和技术来取得竞争优势已不再是秘密.2015年, 如果你还在职场上寻找大数据的相关工作, 那么, 这里介绍的9种技能,将帮助你得到一个工作机会.        1.Apache Hadoop Hadoop现在已经进入第二个10年发展期了, 但不可否认的是, Hadoop在2014年出现了井喷式发展, 由于Hadoop从测试集群向生产和软件供应商方向不断转移, 其越来越接近于分布式存储和处理机架构, 因此, 这一势头在2015年会更加猛烈.由于大数据平台的

零基础学习大数据的完整学习路线

最近很多人都想学习大数据开发,但是却不知道如何开始学习,今天软妹子专门整理了一份针对大数据初学者的大数据开发学习路线. 下面分十个章节来说明大数据开发要学习的内容: 以上就是一个大数据新手,想要学会大数据开发,需要学习的内容,大数据学习是一个持续的过程,只要用心学,没有学不会的东西哦!我要推荐下我自己建的大数据开发学习群:119599574,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享都是学大数据开发的,如果你正在学习大数据,欢迎初学和进阶中的小伙伴.