spark版本定制课程-第1课

1、学习本课程可以自己动手改进spark,或者给spark增加功能。增加某些官方没有提供的功能,通过本课程希望早就一些顶级spark专家,根据整个社会的需要对spark进行扩展或者定制。
2、通过前三课就可以对spark streaming透彻理解
3、为什么要对spark streaming为切入点对spark进行定制?
  #spark最开始并没有streaming等其他框架,最开始就是很原始的spark core,要做自己源码定制版本,以streaming作为切入点,透过对此框架的研究,就可以掌握spark力量的源泉。
  #众多框架中选择spark streaming,首先spark SQL 涉及了太多的语法解析,不太适合研究。sparkR不够成熟,图计算spark GraphX在最近的几个版本发行中并没有什么改进,很有可能GraphX已经发展到尽头,所以也不太适合。另外图计算涉及了太多的数学相关算法。机器学习框架涉及了太多的数学知识,也不是太好的选择。
  #2015年是spark最火的一年,也是流式处理最火的一年。2016年上半年,调查发现spark是大数据领域薪水最高,同时发现streaming是spark最有吸引力的技能。
4、spark streaming魅力所在?
  #流式计算:流处理时代,一切数据如果不是流式处理,都是无效的数据。社会发展会证实这段话
  #流式处理是一个能立即给出反馈,能使用一切其他计算的结果,入机器学习,SQL等。流处理可以和其他框架无缝集成,功能超强。
  #精通spark streaming,薪水极高
  #spark所有程序框架中,spark streaming是最容易出现问题的框架。最多调优的框架,掌握了spark streaming,可以对spark的技能提升到一个新的层次。
  #streaming很像spark core之上的一个应用程序,其他框架则不然,例如机器学习,一般只是封装了向量,实现对应算法。而spark streaming需要不断的感知数据的变化,感知处理的过程。straming是非常复杂的应用的最佳参考。
  #任何技术都有控制点,类似武侠中的独孤九剑,之所以厉害,就是因为独孤九剑高明在于提前预知对手的下一个招式。spark streaming就类似于提前预知了数据的下一步流向。当然,spark core类似于易筋经,同时掌握两种的话就天下无敌了。
5、spark streaming类似spark 中的龙穴,掌握了龙穴就很容易掌握到龙脉

时间: 2024-08-12 05:41:44

spark版本定制课程-第1课的相关文章

Spark版本定制第3天:通过案例对SparkStreaming透彻理解之三

本期内容: 1 解密Spark Streaming Job架构和运行机制 2 解密Spark Streaming 容错架构和运行机制 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应

Spark版本定制第4天:Exactly Once的事务处理

本期内容: 1 Exactly once 容错 2 数据输出不重复 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应用程序.如果可以掌握Spark streaming这个复杂的应用程

Spark版本定制第2天:通过案例对SparkStreaming透彻理解之二

本期内容: 1 解密Spark Streaming运行机制 2 解密Spark Streaming架构 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应用程序.如果可以掌握Spark

Spark版本定制第1天:通过案例对SparkStreaming透彻理解之一

本期内容: 1 Spark Streaming另类在线实验 2 瞬间理解Spark Streaming本质 在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下.这里选择Spark Streaming作为版本定制的切入点也是大势所趋. 小技巧:将Batch interval放大,相当于看到了Streaming的慢放版本,可以更清楚它的各个环节,这里以黑名单过滤程序

Spark版本定制第13天:Driver容错

本期内容 1.ReceivedBlockTracker容错安全性 2.DStreamGraph和JobGenerator容错安全性 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应用

Spark版本定制第5天:案列解析Spark Streaming运行源码

本期内容: 1 在线动态计算分类最热门商品案例回顾与演示 2 基于案例贯通Spark Streaming的运行源码 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应用程序.如果可以掌

Spark版本定制第7天:JobScheduler内幕实现和深度思考

本期内容: 1 JobScheduler内幕实现 2 深度思考 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应用程序.如果可以掌握Spark streaming这个复杂的应用程序,

Spark版本定制第6天:Job动态生成和深度思考

本期内容: 1 Job动态生成 2 深度思考 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应用程序.如果可以掌握Spark streaming这个复杂的应用程序,那么其他的再复杂的

Spark版本定制第9天:Receiver在Driver的精妙实现全生命周期彻底研究和思考

本期内容: 1 Receiver生命周期 2 深度思考 一切不能进行实时流处理的数据都是无效的数据.在流处理时代,SparkStreaming有着强大吸引力,而且发展前景广阔,加之Spark的生态系统,Streaming可以方便调用其他的诸如SQL,MLlib等强大框架,它必将一统天下. Spark Streaming运行时与其说是Spark Core上的一个流式处理框架,不如说是Spark Core上的一个最复杂的应用程序.如果可以掌握Spark streaming这个复杂的应用程序,那么其他