什么样的基础设施适合快速和大数据架构?

为大数据和较新的快速数据架构提供基础设施并不是一个饼干切割的问题。两者对硬件和软件基础设施都有着显著的调整或改变。 较新的快速的数据架构与大数据架构有着显著区别,并且快速数据提供了真正的联机事务处理工具。理解大数据和快速数据需求的变化能够帮助你做出正确的硬件和 软件选择。 大数据架构 相比企业在以往通常收集数据的方法,大数据是通过更大的数据容量,分析和获得更大的洞见的过程,大部分的数据(例如,社会媒体有关客户的数据)是可访问的 公共云。这一数据,反过来,强调快速访问,不再强调一致性,也造就了如Hadoop这样一系列的大数据工具。因此,架构中的如下变化和重点是普遍的: 支持内部软件,如Hadoop和Hive,以及横向扩展的云功能硬件,用于社交媒体或其他大数据输入起作用的场景。 支持现有的数据架构的虚拟化和私有云软件。 支持大规模、深度和ad hoc分析软件,且允许数据科学家为企业定制需求的软件工具。 大规模扩展的存储容量,特别是近实时分析。 快速数据架构 快速数据是可以在近乎实时的情况下处理流传感器和物联网数据的架构。该种架构更聚焦于快速更新,会经常性地放开读取数据的限制,直到有数据被写入磁盘才会 锁定。无论是通过现有的、典型的柱状图、数据库或从专门设计的Hadoop相关工具,采用这种架构工作的企业通常适需要对数据进行一些初始的流分析。在这 一新生领域中,架构和重点的变化是很常见的: 用于快速更新和初始流数据分析的数据库软件。 大幅度提高快速数据存储的非易失性RAM和固态硬盘的使用(例如,1TB的主内存和1PB的SSD); 及时的软件约束,类似于那些旧版实时操作系统。 快速数据架构与大数据架构的融合 快速数据的目的是与大数据架构融合起来。因此,为了将这两种方式融合起来: 数据在快速响应的快速数据和减少限制的大数据存储之间是分离的。 该种融合架构允许使用大数据数据库和分析工具访问快速数据架构存储的数据。 这是一个非常简要的概述,典型的实现和有一系列的选择。主要的供应商销售各种各样的软件和硬件,以涵盖所有的大数据架构和绝大部分的快速数据架构,而开源 供应商涵盖大部分相同的软件领域。因此,快速数据和大数据的实施往往是在成本与速度之间进行的平衡。聪明的买家能够通过增加有效的架构来获得竞争优势。 在快速数据领域的小型供应商Redis Labs和GridGain,大型供应商Oracle和SAP都在快速数据以及大数据两方面发挥了重要的作用。SAP可能是快速数据工具领域更加合适的供 应商。在硬件领域,英特尔对快速数据有浓厚兴趣。其他传统的大数据厂商,如IBM和戴尔在收购EMC的过程中,还没有来得及发表就表现得很兴奋。在IBM 和戴尔两者中间,EMC赚足了面子和里子,因此未来它在快速数据架构方面可能比IBM更有针对性。

TechTarget中国原创内容,原文链接: http://www.searchdatacenter.com.cn/showcontent_92676.htm
© TechTarget中国:http://www.techtarget.com.cn

时间: 2024-08-22 19:52:35

什么样的基础设施适合快速和大数据架构?的相关文章

大数据架构和模式(二)——如何知道一个大数据解决方案是否适合您的组织

简介 在确定投资大数据解决方案之前,评估可用于分析的数据:通过分析这些数据而获得的洞察:以及可用于定义.设计.创建和部署大数据平台的资源.询问正确的问题是一个不错的起点.使用本文中的问题将指导您完成调查.答案将揭示该数据和您尝试解决的问题的更多特征. 尽管组织一般情况对需要分析的数据类型有一些模糊的理解,但具体的细节很可能并不清晰.毕竟,数据可能具有之前未发现的模式的关键,一旦识别了一种模式,对额外分析的需求就会变得很明显.要帮助揭示这些未知的未知信息,首先需要实现一些基本用例,在此过程中,可以

大数据架构和模式(二)如何知道一个大数据解决方案是否适合您的组织

本文收藏于http://kb.cnblogs.com/page/510979/ 作者: Divakar等  来源: DeveloperWorks  发布时间: 2015-01-29 18:20  阅读: 1542 次  推荐: 0   原文链接   [收藏] 摘要:本文介绍一种评估大数据解决方案的可行性的基于维度的方法.通过回答探索每个维度的问题,您可以通过自己对环境的了解来确定某个大数据解决方案对您是否适合.仔细考虑每个维度,就会发现有关是否到了改进您的大数据服务的时候的线索. 简介 在确定投

大数据好学习吗?如何快速掌握大数据开发技能

大数据好学习吗?如何快速掌握大数据开发技能?经常被学员问到:大数据好学吗?想学大数据怕学不会等问题.我想说的是,大数据在当下是个非常热门的话题,大数据在深刻的影响着这个世界,在促进传统行业升级改造.引领新兴产业和新兴应用蓬勃发展.提升社会运行和管理效率等方面,大数据正引发新一轮革命.大数据是时代潮流,如果学一下就会了,那大数据行业现在恐怕已经被挤破门槛了吧,想学大数据还是得下苦功夫才行. 想学大数据,先把这几个技能学会再说: Apache Hive2.1 Hive是建立在Hadoop上的数据仓库

快速传输大数据(tar+lz4+pv)

快速传输大数据(tar+lz4+pv) 如果用传统SCP远程拷贝,速度是比较慢的.现在采用lz4压缩传输.LZ4是一个非常快的无损压缩算法,压缩速度在单核300MB/S,可扩展支持多核CPU.它还具有一个非常快速的解码器,速度单核可达到和超越1GB/S.通常能够达到多核系统上的RAM速度限制. 你PV 全命为Pipe Viewer,利用它我们可以查看到命令执行的进度. 下面介绍下lz4和pv的安装,下载软件: 下载pv-1.1.4.tar.gz wget http://sourceforge.j

教你零基础如何快速入门大数据技巧

现在是大数据时代,很多人都想要学习大数据,因为不管是就业前景还是薪资都非常的不错,不少人纷纷从其他行业转型到大数据行业,那么零基础的人也想要学习大数据怎么办呢?下面一起探讨下零基础如何快速入门大数据技巧吧. 很多人都需要学习大数据是需要有一定的基础的,编程语言就是必备的条件之一,编程语言目前热门的有:Java.Python.PHP.C/C++等等,无论是学习哪一门编程语言,总之要精细掌握一门语言是非常必须的,我们先拿应用广泛的Java说起哦. .在入门学习大数据的过程当中有遇见学习,行业,缺乏系

五个顶级的大数据架构

五个顶级的大数据架构 自从像AWS这样的公共云产品开辟了大数据分析功能以来,小企业通过挖掘大量的数据做到只有大企业才能做到的事情,至今大约有10年时间.这些事情其中包括网络日志.客户购买记录等,并通过按使需付费的方式提供低成本的商品集群.在这十年中,这些产品蓬勃发展,涵盖了从实时(亚秒级延迟)流媒体式分析到用于分析批量模式工作的企业数据仓库,而企业数据仓库则可能需要数天或数周才能完成. 以下将介绍用于大数据堆栈的五个最有用的架构,以及每个架构的优点,以便更好地理解和权衡.此外,还对成本(按$ -

五个顶级的大数据架构----大数据程序员必修课

自从像AWS这样的公共云产品开辟了大数据分析功能以来,小企业通过挖掘大量的数据做到只有大企业才能做到的事情,至今大约有10年时间.这些事情其中包括网络日志.客户购买记录等,并通过按使需付费的方式提供低成本的商品集群. 自从像AWS这样的公共云产品开辟了大数据分析功能以来,小企业通过挖掘大量的数据做到只有大企业才能做到的事情,至今大约有10年时间.这些事情其中包括网络日志.客户购买记录等,并通过按使需付费的方式提供低成本的商品集群.在这十年中,这些产品蓬勃发展,涵盖了从实时(亚秒级延迟)流媒体式分

大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术

大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来.为了能够更好的架构大数据项目,这里整理一下,供技术人员,项目经理,架构师选择合适的技术,了解大数据各种技术之间的关系,选择合适的语言. 我们可以带着下面问题来阅读本文章: 1.hadoop都包含什么技术 2.Cloudera公司与hadoop的关系是什么,都有什么产品,产品有什么特性 3. Spark与hadoop的关联是什么? 4. Storm与hadoop的关联是什么

后Hadoop时代的大数据架构

提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本.我把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补充.我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop – 董飞的回答,为了给大家有个铺垫,简单讲一些相关开源组件. 背景篇 MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进