两款高性能并行计算引擎Storm和Spark比較

对Spark、Storm以及Spark Streaming引擎的简明扼要、深入浅出的比較。原文发表于

q=spark" rel="nofollow">踏得网

Spark基于这种理念,当数据庞大时,把计算过程传递给数据要比把数据传递给计算过程要更富效率。

每一个节点存储(或缓存)它的数据集。然后任务被提交给节点。

所以这是把过程传递给数据。

这和Hadoop?map/reduce很相似,除了积极使用内存来避免I/O操作,以使得迭代算法(前一步计算输出是下一步计算的输入)性能更高。

Shark仅仅是一个基于Spark的查询引擎(支持ad-hoc暂时性的分析查询)

而Storm的架构和Spark截然相反。Storm是一个分布式流计算引擎。每一个节点实现一个主要的计算过程。而数据项在互相连接的网络节点中流进流出。和Spark相反,这个是把数据传递给过程。

两个框架都用于处理大量数据的并行计算。

Storm在动态处理大量生成的“小数据块”上要更好(比方在Twitter数据流上实时计算一些汇聚功能或分析)。

Spark工作于现有的数据全集(如Hadoop数据)已经被导入Spark集群,Spark基于in-memory管理能够进行快讯扫描,并最小化迭代算法的全局I/O操作。

只是Spark流模块(Streaming?Module)倒是和Storm相相似(都是流计算引擎)。虽然并不是全然一样。

Spark流模块先汇聚批量数据然后进行数据块分发(视作不可变数据进行处理)。而Storm是仅仅要接收到数据就实时处理并分发。

不确定哪种方式在数据吞吐量上要具优势。只是Storm计算时间延迟要小。

总结下,Spark和Storm设计相反,而Spark?Steaming才和Storm相似。前者有数据平滑窗体(sliding?window),而后者须要自己去维护这个窗体。

By Techbrood Co.

原文地址:https://www.cnblogs.com/ldxsuanfa/p/10612603.html

时间: 2024-10-10 10:03:13

两款高性能并行计算引擎Storm和Spark比較的相关文章

两款高性能并行计算引擎Storm和Spark比较

来自http://blog.csdn.net/iefreer/article/details/32715153 Spark基于这样的理念,当数据庞大时,把计算过程传递给数据要比把数据传递给计算过程要更富效率.每个节点存储(或缓存)它的数据集,然后任务被提交给节点. 所以这是把过程传递给数据.这和Hadoop map/reduce非常相似,除了积极使用内存来避免I/O操作,以使得迭代算法(前一步计算输出是下一步计算的输入)性能更高. Shark只是一个基于Spark的查询引擎(支持ad-hoc临时

Storm和Spark比较

spark Spark基于这样的理念,当数据庞大时,把计算过程传递给数据要比把数据传递给计算过程要更富效率. 每个节点存储(或缓存)它的数据集,然后任务被提交给节点.所以这是把计算过程传递给数据. 这和Hadoop map/reduce非常相似,除了积极使用内存来避免I/O操作,以使得迭代算法(前一步计算输出是下一步计算的输入)性能更高. storm 而Storm的架构和Spark截然相反.Storm是一个分布式流计算引擎. 每个节点实现一个基本的计算过程,而数据项在互相连接的网络节点中流进流出

沙漠之鹰和战术匕首--两款前端极简模板引擎

一.前言 说起前端模板引擎,那可真是多如牛毛,只要是前端coder,怎么着你都听说或用过几款,社区里面的文章也有介绍,或者问问度娘,这里不再赘述.其中比较知名的有 artTemplate.doT.mustache等. 本文介绍两款极简模板引擎:一款原创format引擎,一款优化template引擎.每个模板引擎都只有区区三十行左右的代码. 二.模板原则 模板概念的提出,不管起源是什么,最根本的原则一定是要解决开发中的问题:显示逻辑和数据逻辑能够分离.而实际开发需求中,两者分离的需求也不尽相同.

从Storm和Spark Streaming学习流式实时分布式计算系统的设计要点

0. 背景 最近我在做流式实时分布式计算系统的架构设计,而正好又要参见CSDN博文大赛的决赛.本来想就写Spark源码分析的文章吧.但是又想毕竟是决赛,要拿出一些自己的干货出来,仅仅是源码分析貌似分量不够.因此,我将最近一直在做的系统架构的思路整理出来,形成此文.为什么要参考Storm和Spark,因为没有参照效果可能不会太好,尤其是对于Storm和Spark由了解的同学来说,可能通过对比,更能体会到每个具体实现背后的意义. 本文对流式系统出现的背景,特点,数据HA,服务HA,节点间和计算逻辑间

Storm与Spark:谁才是我们的实时处理利器

实时商务智能这一构想早已算不得什么新生事物(早在2006年维基百科中就出现了关于这一概念的页面).然而尽管人们多年来一直在对此类方案进行探讨,我却发现很多企业实际上尚未就此规划出明确发展思路.甚至没能真正意识到其中蕴含的巨大效益. 为什么会这样?一大原因在于目前市场上的实时商务智能与分析工具仍然非常有限.传统数据仓库环境针对的主要是批量处理流程,这类方案要么延迟极高.要么成本惊人——当然,也可能二者兼具. 然而已经有多款强大而且易于使用的开源平台开始兴起,欲彻底扭转目前的不利局面.其中最值得关注

2016年 最火的 15 款 HTML5 游戏引擎

HTML5游戏从2014年Egret引擎开发的神经猫引爆朋友圈之后,就开始一发不可收拾,今年<传奇世界>更是突破流水2000万!从两年多的发展来看,游戏开发变得越来越复杂,需要制作各种炫丽的效果,还要制作各种基于 2D 或者 3D 的场景.作为一名开发者,分析了当下最火爆,最热门的HTML5游戏引擎供大家参考,希望大家也能找到属于自己的那款游戏开发引擎. 我在github上面收集了四十多款的HTML5开源游戏引擎,从里面star.fork等等参数分析其流行度,最后综合各方面元素,筛选出靠前的十

Apache Storm 与 Spark:对实时处理数据,如何选择【翻译】

原文地址 实时商务智能这一构想早已算不得什么新生事物(早在2006年维基百科中就出现了关于这一概念的页面).然而尽管人们多年来一直在对此类方案进行探讨,我却发现很多企业实际上尚未就此规划出明确发展思路.甚至没能真正意识到其中蕴含的巨大效益. 为什么会这样?一大原因在于目前市场上的实时商务智能与分析工具仍然非常有限.传统数据仓库环境针对的主要是批量处理流程,这类方案要么延迟极高.要么成本惊人--当然,也可能二者兼具. 然而已经有多款强大而且易于使用的开源平台开始兴起,欲彻底扭转目前的不利局面.其中

Storm与Spark、Hadoop三种框架对比

一.Storm与Spark.Hadoop三种框架对比 Storm与Spark.Hadoop这三种框架,各有各的优点,每个框架都有自己的最佳应用场景.所以,在不同的应用场景下,应该选择不同的框架. 1.Storm是最佳的流式计算框架,Storm由Java和Clojure写成,Storm的优点是全内存计算,所以它的定位是分布式实时计算系统,按照Storm作者的说法,Storm对于实时计算的意义类似于Hadoop对于批处理的意义.Storm的适用场景:1)流数据处理Storm可以用来处理源源不断流进来

推荐13款javascript模板引擎

javaScript 在生成各种页面内容时如果能结合一些模板技术,可以让逻辑和数据之间更加清晰,本文介绍 X 款 JavaScript 的模板引擎.(排名不分先后顺序) 1. Mustache 基于javascript 实现的模板引擎,类似于 Microsoft’s jQuery template plugin,但更简单易用! 2. EasyTemplate 在使用过Freemarker模 板后,感觉它的 语法比较朴实,平易近人,容易上手,于是决定按它的语法风格实现一个前端的 模板引擎,这就有了