大三学习规划路线图

路线图介绍:

本课程对大数据生态系统进行全方位讲解,有hadoop实操与底层原理应用,DFS与MapRedcue的全新解读,内含有全网独家发布的YARN调度框架的底层事件二次分发机制和Google源码级IPC和RPC的通信技术原理与报文字节码级别的协议分析,Scala语言的编程技巧与java语言的互操作性,Spark中数据处理如何弹性化、如何调优以及对Scala编程语言的典型应用。ZooKeeper作为分布式系统协同服务的原理实现与实战应用,zkCli下同zk的交互模式以及素有瑞士***之称的NC指令在zk中的运用,Hbase作为面向列族的数据库实现原理以及同ZooKeeper的整合技术,Hive数据仓库技术的使用技巧以及在传统RDBMS的交互与过渡。Mahout以R语言在机器学习领域的重要性和编程技能,Linux下虚拟化与云计算的技术讲解及实战应用。各种streaming数据处理以加压缩技术的性能对比和优化,独立搭建Hortonworks本地仓库,并利用Ambari技术在企业大规模构造大数据规模化集群时的实战过程,一站式安装、配置、调优、监控、运维大数据集群的解决方案。

本路线图针学习目标:

掌握大数据概念和核心应用场景,能够彻底认识到大数据的重要性,以及能够有效把握未来大数据的发展方向。能够掌握hadoop的技术架构和底层原理,对分布式架构能够做到更深入的认识和体会,尤其是yarn框架的底层事件分发机制、轮询机制、多线程以及nio的组合应用。还有更重要的基于google的IPC通信技术。能够独立搭建hadoop集群、配置以及管理。能够灵活应用hadoop生态系统的各种技术进行数据处理。其中对Linux的技术知识也不可小觑,能够搭建各种仓库本地,比如ubuntu软件源、ambari、maven等等一系列组件,都是在企业中极其适用的技术。掌握spark和核心技术尤其是RDD的原理与使用,还有scala语言的掌握。

第一阶段:Hadoop基础环境搭建与3种模
介绍 学员请先学习本部分基础课程。本部分将主要讲解Hadoop基础环境搭建与3种模式配置!
技术大点1:Hadoop第一季--基础知识实战视频课程
重点解析:本课准对大数据进行基础的环境搭建,目前市场比较火的大数据,我们会从基础搭建开始一步步教学
序号 技术点细分
1 Hadoop介绍
2 Hadoop基础课程VMware安装
3 Hadoop基础课程Ubuntu下载与虚拟机下安装
4 Hadoop基础课程Ubuntu常用命令
5 Hadoop基础课程Ubuntu目录和权限
6 Hadoop基础课程Ubuntu软件包桌面程序以及增强工具
7 Hadoop基础课程Ubuntu本地软件源与ISO制作
8 Hadoop基础课程Ubuntu克隆与Mac生成&网络连接方式
9 Hadoop在Ubuntu下安装JDK
10 Hadoop在Ubuntu下安装Hadoop
技术大点2:Hadoop第二季-1.配置独立模式视频课程
重点解析:介绍hadoop独立模式,场景使用。一步步演示怎么配置独立模式,并且通过案例介绍独立模式,学完此课程学生会明白伪分布模式与独立模式,完全模式的区别。
序号 技术点细分
1 Hadoop配置独立模式
技术大点3:Hadoop第二季-2.伪分布式模式的配置视频课程
重点解析:学会如何配置伪分布模式以及使用场景,一步步演示怎么配置伪分布模式,学完此课程学生会明白伪分布模式与独立模式的区别
序号 技术点细分
1 Hadoop配置伪分布式模式
技术大点4:Hadoop第二季-3.配置完全分布式模式视频课程
重点解析:hadoop三种模式:独立模式,伪模式,完全分布模式。目前常用配置模式,学会使用配置完全分布模式。
序号 技术点细分
1 Hadoop配置完全分布模式之修改虚拟机名称和目录
2 Hadoop配置完全分布模式之修改登录提示和主机名
3 Hadoop配置完全分布模式之使用符号链接实现配置分离
4 Hadoop完全分布模式之克隆客户机与ssh远程无密登录
5 .Hadoop配置完全分布模式之IP设置与远程拷贝与格式化启动
第二阶段:win7下面配置环境以及mapred
介绍 win7下面配置环境以及mapreduce架构分析与应用
技术大点5:Hadoop第三季-Win7下免搭建Cygwin视频课程
重点解析:在win7下面即使不安装cygwin软件,也能在win7下面搭建hadoop环境,中间只需要引入一个第三方增强软件(hadoop-common.zip)即可。
序号 技术点细分
1 hadoop在Win7下免Cygwin安装以及第三方增强软件介入
2 Win7下免Cygwin安装续与NativeBug解决与Dexpot
技术大点6:Hadoop第四季-架构分析实战视频课程
重点解析:掌握架构结构,体系结构,HDFS架构分析,NN和DN原生解读,Hadoop架构分析之启动脚本分析一
序号 技术点细分
1 Hadoop架构分析之单节点体系
2 Hadoop架构分析之集群结构分析
3 Hadoop架构分析之HDFS架构分析
4 Hadoop架构分析之NN和DN原生文档解读
5 Hadoop架构分析之启动脚本分析一
技术大点7:Hadoop第五季-启动脚本分析视频课程
重点解析:让想学习hadoop的人知道hadoop启动原理,全方便的掌握hadoop原理。
序号 技术点细分
1 Hadoop启动脚本分析集群id的兼容与start-allcmd讲解
2 Hadoop启动脚本分析start-dfs与hadoop-config
3 Hadoop启动脚本分析hadoop.cmd命令
4 Hadoop启动脚本分析数据格式化与hdfs.cmd命令
5 Hadoop启动脚本分析mared和虚拟机参数的配置
6 Hadoop启动脚本分析start-yarn命令
7 Hadoop启动脚本分析yarn.cmd与yarn-evn.cmd命令
8 Hadoop架构分析之启动脚本分析终极hdsfs部分
9 Hadoop架构分析之启动脚本分析终极yarn部分
技术大点8:Hadoop第六季-MapReduce代码实现案例视频课程
重点解析:通过此章可以快速了解MapReduce,并且通过代码实现大数据编写
序号 技术点细分
1 Hadoop  MapReduce初识
2 Hadoop  MapReduce编写Mapper类
3 Hadoop  MapReduce编写Reducer类
4 Hadoop  MapReduce编写主函数类
5 Hadoop  MapReduce独立模式运行程序
技术大点9:Hadoop第七季-MapReduce定制block限制+输入切
重点解析:了解学习MapReduce集群模式下一些知识
序号 技术点细分
1 Hadoop  MapReduce集群模式下运行程序
2 Hadoop  MapReduce集群模式调整配置与shell
3 Hadoop  MapReduce集群模式调整配置最小块
4 Hadoop  MapReduce集群模式调整配置考查数据分布
5 Hadoop  MapReduce定制切割与副本数以及块大小定制
6 Hadoop  MapReduce集群模式深入定制切割与切割法则考查
7 win7下配置networks文件映射主机名和端口号利于网络访问
8 MapReduce原理之物理导航+eclipse安装+后台启动+命令化
9 Hadoop  MapReduce原理之Hadoop插件安装+配置+验证
10 Hadoop  MapReduce原理之与大象装进冰箱的相似点
11 Hadoop  MapReduce原理之进入流程图
12 Hadoop  MapReduce原理之核心类Job和ResourceManager解读
13 Hadoop  MapReduce原理之核心类NodeManager和MRAppMaster解读
14 Hadoop  MapReduce原理核心类Yarn与MapTask与ReduceTask
15 Hadoop  MapReduce原理之核心类RM与NM与AM的体系结构分析
技术大点10:Hadoop第八季-1.MapReduce原理探查准备视频课程
重点解析:一般同学只会用而不知道原理,为了增加工作中更好的应用MapReduce,徐培成老师对MapReduce原理进行3个课程的分析。
序号 技术点细分
1 Hadoop  MR win7下配置networks文件
2 Hadoop  MapReduce原理之物理导航等命令化操作
3 Hadoop  MapReduce原理之Hadoop插件安装+配置+验证
技术大点11:Hadoop第八季--2.MapReduce原理探查与大象关进冰
重点解析:对hadoop中MapReduce原理探查与大象关进冰箱+流程图
序号 技术点细分
1 Hadoop  MapReduce原理之与大象装进冰箱的相似点
2 Hadoop  MapReduce原理之进入流程图
技术大点12:Hadoop第八季-3.MapReduce原理探查核心类整理分析
重点解析:对Hadoop中MapReduce原理探查核心类整理分析 ,全面了解MapReduce
序号 技术点细分
1 Hadoop  MapReduce原理之核心类Job和ResourceManager解读
2 Hadoop  MapReduce原理之核心类NodeManager和MRAppMaster解读
3 Hadoop  MR原理之核心类Yarn与MapTask与ReduceTask解读
4 Hadoop  MapReduce原理之核心类RM与NM与AM的体系结构分析
技术大点13:Hadoop第九季-1.MapReduce原理代码实战异常再现+A
重点解析:对hadoop中MapReduce原理通过代码实战讲解并且通过异常再现+Ant
序号 技术点细分
1 Hadoop  MapReduce原理代码实战之错误信息展现于分析
2 Hadoop  MapReduce原理代码实战之Ant使用
技术大点14:Hadoop第九季--2.MapReduce原理代码实战Job提交推
重点解析:MapReduce客户端提交job的流程分析、job内部提交过程展示、job在提价后在hdfs集群上的各个文件内容与部分以及web  ui的操作。
序号 技术点细分
1 Hadoop  MapReduce原理代码实战之Job提交推演
技术大点15:Hadoop第九季-3.MapReduce原理探查核心类整理分析
重点解析:从底层源代码阐述MR原理技术,核心类的关系和体系结构,图文并茂解析理论。
序号 技术点细分
1 Hadoop  MapReduce原理代码实战之Job初始化分析
2 Hadoop  MapReduce原理代码实战之ResourceManager远程调试
第三阶段:YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
介绍 YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
技术大点16:Hadoop第十季-YARN调度框架事件二次分发原理深度解
重点解析:掌握YARN底层事件调度机制,清晰描述Application基于状态机的变换过程和实现原理,事件流处理方式,eclipse的远程调试。
序号 技术点细分
1 Hadoop  Yarn框架底层事件分发机制概述
2 Hadoop  Yarn框架底层事件分发调试准备
3 Hadoop  Yarn框架底层事件分发调试Async分发器调试
4 Hadoop  Yarn底层事件分发调试RMApp事件处理调试+状态机变换
5 Hadoop  Yarn框架底层事件分发调试之状态机事件触发原理
技术大点17:Hadoop第十一季-Hadoop底层IPC和RPC通信原理解析
重点解析:通过对Hadoop底层通信原理的阐述以及在源代码层面上的跟踪,结合图形方式描述请求发送时,消息的封装过成,让大家理解hadoop在底层的通信过程,最终看到Socket通信的内容。
序号 技术点细分
1 Hadoop  底层IPC和RPC通信原理解析
第四阶段:Ambari、ZooKeeper、Hbase
介绍 YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
技术大点18:Ambari第一季-ambari介绍、安装使用以及常见问题视
重点解析:通过本章节介绍了解ambari的优点,工作原理,能够熟练对ambari进行安装配置,以及解决常见的错误和问题。了解HDP和HDP  utils以及hortonworks项目。
序号 技术点细分
1 Ambari  Hadoop集群管理软件之介绍
2 Ambari  Hadoop集群管理软件之下载安装配置启动登
3 Ambari之疑难问题解决与Root账户无密登录处理
技术大点19:Ambari第二季--集群管理本地软件栈构建与使用视频课程
重点解析:掌握HDP软件栈的执行原理,能够数量进行HDP、Ambari等软件的本地仓库升级与配置。
序号 技术点细分
1 Ambari  Hadoop集群管理软件之HDP软件栈本地仓库搭建
2 Ambari  Hadoop集群管理软件之AmbariServer通过本地仓库安装
3 Ambari  Hadoop集群管理软件之Hadoop集群本地化安装
技术大点20:ZooKeeper第一季-ZK简介、下载与安装视频课程
重点解析:了解ZooKeeper用途、原理,掌握ZooKeeper集群构建过程,解决在安装期间常见的问题和错误。
序号 技术点细分
1 ZooKeeper简介
2 ZooKeeper下载与安装
技术大点21:ZooKeeper第二季-Leader宕机演示、nc、zkCli命令使
重点解析:掌握Leader的选举过程,nc命令的使用,包括tcp网络传输、文本聊天和端口扫描。zkCli命令的使用,zk的核心概念和专业术语。
序号 技术点细分
1 ZooKeeper分布式集群配制与Leader宕机测试
2 ZooKeeper分布式集群配制与nc  Linux命令的网络通信利器
3 ZooKeeper分布式集群配制与zk四字符客户端指令
4 ZooKeeper分布式集群配制与zkCli.sh客户端程序使用
技术大点22:ZooKeeper第三季-ZK客户端编程API使用、观察者模式回调处理视频课程
重点解析:掌握zk核心类库的使用和编程技巧,重点在zk观察者中事件回调机制的使用以及one  time方式的注意事项。
序号 技术点细分
1 ZooKeeper分布式集群协同之客户端API调用
2 ZooKeeper分布式集群协同之客户端API创建和删除path
3 ZooKeeper客户端API观察者模式与事件回调处理
技术大点23:HBase内功修炼实战视频课程
重点解析:HBase直接上手实战,深入掌握HBase。
序号 技术点细分
1 HBase介绍
2 HBase安装、体验
3 HBase完全分布式配置、启动与shell命令查看
4 HBase使用客户端API动态创建Hbase数据表并在Hbase下导出执行
5 HBase使用客户端API完成数据库CRUD操作
6 HBase使用新型API类库进行数据访问操作
7 HBase新API大批量插入以及hbase表结构与Hadoop文件系统
8 HBase与ZooKeeper组合应用以及在shell下操纵namespace.avi
技术大点24:Scala精通与实战编程视频课程
重点解析:掌握Scala的编程语法,理解Scala的运行原理,熟练运用Scala进行程序开发,能够在Java和Scala之间灵活切换和互操作。
序号 技术点细分
1 Scala介绍与安装
2 Scala基础
3 Scala操作符重载与Apply与包导入
4 Scala控制结构与函数
5 Scala异常处理与过程与延迟初始化
6 Scala数组与多维数组
第五阶段:征服Spark
介绍 YARN调度框架事件与Hadoop底层IPC和RPC通信原理解析
技术大点25:征服Spark(一)入门与提高篇视频课程
重点解析:掌握Spark核心概念和技术原理掌握Spark与Hadoop的优势对比掌握Spark的两种安装方式与集群的构建掌握Spark的核心概念Resilient  Distributed  Dataset.掌握Maven的工作原理以及本地Maven仓库服务器的搭建与配置掌握Spark集群的部署模式以及shell的应用掌握Spark编程与运行
序号 技术点细分
1 Spark简介
2 Spark预编译版本下载安装与启动
3 Spark体验shell操作与wc操作与RDD介绍
4 Spark通过Maven进行源码编译安装
5 Spark搭建Maven本地仓库服务器
6 Spark通过本地Maven仓库服务器进行编译
7 Spark官方doc的宏观描述和优势说明
8 Spark独立集群模式部署和启动
9 Spark  Master和Worker的webui查看以及FIFO作业调度讲解
10 Spark独立集群模式端口修改
技术大点26:征服Spark(二)Spark项目编译运行篇视频课程
重点解析:了解sbt(simple build  tool)掌握使用maven对Spark的项目进行编译和运行,理解addFile的操作原理和Spark的整体概述掌握maven的pom文件的配置掌握eclipse下maven的使用与spark项目的构建以及仓库的配置。
序号 技术点细分
1 Spark  shell应用于addFile
2 Spark程序build的宏观介绍
3 通过交互模式初始化Maven项目
4 通过参数指定方式直接初始化Maven项目
5 准备java源文件到自己的源码包中
6 设置pom.xml文件依赖插件以及与自由仓库目录树的对应关系
7 使用mvn  package指令进行编译并进行打包
8 使用java指令添加spark类库运行Spark程序
9 使用maven的exec执行插件运行java程序
10 配置eclipse的maven插件使用本地maven仓库服务器
11 eclipse之下maven项目的配置编译运行
12 eclipse之Scala插件的卸载与安装
13 eclipse下构建Scala程序以及运行
14 通过Scalac命令手动编译scala程序并执行
15 命令行下通过maven编译运行Scala程序
16 eclipse下通过maven+scala插件用Scala开发Spark应用
时间: 2024-10-23 23:30:30

大三学习规划路线图的相关文章

u-boot分析(十一)----MMU简单分析|u-boot分析大结局|学习规划

u-boot分析(十一) 通过前面十篇博文,我们已经完成了对BL1阶段的分析,通过这些分析相信我们对u-boot已经有了一个比较深入的认识,在BL2阶段大部分是对外设的初始化,并且有的我们已经分析过,在这篇博文我打算对BL1阶段没有分析到的重要外设进行简单分析,并结束对u-boot的分析,同时对后面自己的博文进行简单的规划,希望有兴趣的朋友跟我一块学习和研究嵌入式. 今天我们会分析到以下内容: 1.      MMU分析(内容出自我以前的博客) 2.      裸机开发总结 3.      后期

揭秘java大数据学习路线图

很多的同学在学习JavaEE的路上都过得的是坎坷,可以说是夜以继日的敲代码在学习,却发现自己是事倍功半,有的时候遇到一个bug真的很难受,无限互联java大数据培训专家为大家整理了一篇很值得大家去借鉴的学习路线图文章,希望大家在学习的路上一能帆风顺! 一.Java的核心 这就是学习Java的基础,掌握程度的深与浅甚至直接影响后面的整个学习进程. Java的核心主要包括了几个部分: 一. java大数据学习路线图 1.初级的有语法基础.面向对象思想. 学习任何一门语言语法都是必须的,因为Java的

2015上半年,大三下,我的学习总结

我这学期的情况概述: 这学期才开始学习一些web技术的,所以水平噪点还很多. 从最基础的web前端HTML.CSS开始看视频搜百度,看了燕十八的基础视频课程,做了些小练习: 到学习后端JAVAweb,练习了以jsp +servlet+javaweb+jdbc+mysql为支持的未完善的购物小站(GitHub代码库[oneshop]): 然后转而学习PHP,后学习了Thinkphp框架,练习了以thinkphp+amazeui+mysql的学习平台(GitHub代码库[ilearn]); 接着买了

2018年大数据学习路线图新鲜出炉:从此小白也能学懂编程

移动互联网的迅速崛起让数据变得更为多样.丰富.它的移动性,它的碎片化,它的私密性和随时性都刚好弥补了用户离开桌面电脑之后的数据,从而与原有的互联网数据一起很好滴勾勒出一个网民一天的生活,日常生活的数据化.现如今大数据已经上升到国家战略层面,企业对于大数据的关注和重视程度也在不断提升.今天小编就给大家分享一下2018年最新大数据学习路线图,希望能对广大大数据爱好者有所帮助. 第一阶段 Java语言基础: Java开发介绍.熟悉Eclipse开发工具.Java语言基础.Java流程控制.Java字符

大数据学习路线图 让你精准掌握大数据技术学习?

大数据指不用随机分析法这样捷径,而采用所有数据进行分析处理的方法.互联网时代每个企业每天都要产生庞大的数据,对数据进行储存,对有效的数据进行挖掘分析并应用需要依赖于大数据开发,大数据开发课程采用真实商业数据源并融合云计算+机器学习,让学员有实力入职一线互联网企业. 今天小编的技术分享详细学习大数据的精准路线图,学好大数据就还得靠专业的工具. 大数据学习QQ群:119599574 阶段一. Java语言基础 Java开发介绍.熟悉Eclipse开发工具.Java语言基础.Java流程控制.Java

大三仍是Linux系统小白的我给大家讲讲学习历程

我与Linux结缘是在大三的时候.我与Linux熟识是在偶然遇到<Linux就该这么学>的时候.因为我是电子信息工程专业,在高年级时开设了嵌入式课程,嵌入式系统是一种专用的计算机系统,作为装置或设备的一部分.所有带有数字接口的设备,如录像机.车子等,都使用嵌入式系统,有些嵌入式系统还包含操作系统.嵌入式操作系统包括μC/OS-II.嵌入式Linux.VxWorks等,但大部分嵌入式操作系统是不开源且不能免费使用,只有Linux是基于GPL协议,所以它成为了嵌入式系统的绝对主流. 我们学校的嵌入

【51CTO微职位】-大数据高级工程师2018年学习总结及2019年学习规划

本人是从零基础开始学本课程.java是2017年下半年看<java从入门到精通>掌握一点基础,但没有完整写过一个Java项目代码,可以说是代码量为零.2018年8月10日,正式开始51CTO微职位培训-大数据高级工程师,技术流的开始.到现在已经全部把必修课程看完,storm.cdh都看到.之前学习还是挺慢的白天上班,晚上学习.但10月之后一心准备辞职,白天基本也在看视频学习,并且2倍语速看.李老师的语速很快,2倍比较快,建议1.5倍语速.调快语速一定要心无旁骛,否则走神容易跟不上.这点根据个人

大数据学习第三天

大数据学习第三天 tar 解压gz安装包 -zxvf yum install 软件名 下载软件 rpm 安装rpm文件 -qa 查看所有已安装rpm文件 yum 网络安装 clean all 清除所有缓存文件 makecache 重建依赖关系文件 /etc/yum.repos.d/ 目录中的依赖文件 网络源 mirror.aliyun.com 本地源 http://改为 file:// enable=1 gpgcheck=1 预编译流程 查看READEME文件 根据文件选择预编译指令 make编

如何从零开始规划大数据学习之路?

大数据的领域非常广泛,往往使想要开始学习大数据及相关技术的人望而生畏.大数据技术的种类众多,这同样使得初学者难以选择从何处下手.本文将为你开始学习大数据的征程以及在大数据产业领域找到工作指明道路,提供帮助. 大数据学习QQ群:119599574 如何开始学习大数据? 人们想开始学习大数据的时候,最常问我的问题是,"我应该学Hadoop(hadoop是一款开源软件,主要用于分布式存储和计算,他由HDFS和MapReduce计算框架组成的,他们分别是Google的GFS和MapReduce的开源实现