大数据和云计算的鞍马情-【软件和信息服务】2014.08

自从VMware在2013年的全球用户大会上推出vSphere Big Data Extention(BDE)以来,大数据这匹骏马越来越受到大家的追捧。当然BDE主要针对是Hadoop的大数据应用,其实大数据不仅仅是Hadoop,即使只算Hadoop也还有不同的发布版本。但是无论Hadoop的哪个版本或者哪个大数据平台,都蜂拥开始追随云计算,就像好马配好鞍一样重要,那怎样的云计算平台才是大数据的好鞍呢?

运行环境平台:多租户、资源供应和管理

  在过去几个月的客户沟通中,我听到了运行大数据的多种不同平台,包括Twitter使用的Mesos、Fedex使用的虚拟化和Yahoo使用的Yarn。而不同的云计算平台特性能解决大数据应用的不同问题。比如:Yarn的目标是支持Hadoop上的非M-R应用。而Twitter使用的Mesos则可以支持混合的负载,并且会利用操作系统的虚拟化。由于企业的大数据应用场景往往是多样的,所以需要选择一种平台适合不同的应用场景,这包括:

  • 部署新的大数据应用极其简单:可以通过自动化和自助服务来完成;
  • 可以支持多种不同的负载:也就是能运行多种大数据应用,不仅仅限于Map-Reduce,还可支持一些Hadoop生态圈应用、SQL服务和其他通用应用;
  • 可靠的安全隔离:如果需要将某些敏感信息隔离,该平台有能力确保数据集和环境安全;
  • 安全的资源隔离:为了能够提供足够的资源来满足整体SLA要求,可以将吵闹的邻居隔离来确保性能;
  • 多版本支持能力:能运行多个不同版本的运行环境,满足不同用户、开发者要求;
  • 企业级的可用性:确保整个系统的强壮性,提供企业等级的可用性。

网络的挑战

  对网络而言,挑战和机遇并存。今天两层核心聚合交换网络不能跨机架提供足够的带宽。机架内的带宽应该没有问题,经常可以达到每秒几百Gbit,但机架间的带宽往往十分有限,为此往往需要优化流量到本地,也就是数据和计算完全整合的模式。幸运的是,新的网络拓扑,包括CLOS和主干加分支设计都提供了很好的解决方案。使用这些新型的网络拓扑,可以在整个集群延时基本恒定的情况下确保足够的带宽,无论是机架内还是机架间都不会有带宽问题。

存储平台的选择

  随着存储技术的不断发展,大数据的存储选择越来越丰富。当然Hadoop的HDFS处于最核心圈,但其他的存储平台也可以提供跟Hadoop类似、即插即用的兼容能力,并且提供了某些独特的价值。几个主要的存储选项如下:

  传统的SAN或者NAS:这应该算是支撑大数据应用的最佳存储选项,因为目前大量的数据中心都可以提供这样的存储选项,并且也包括了各种存储服务,例如:快照、归档、复制等;

  服务器内置磁盘构建的软件定义存储:这方面HDFS是主要的代表,其他的选项包括CEPH、Gluster和MAPR,他们都可以建立文件系统,满足大数据的应用;

  横向扩展存储方案:很多独具特色的新兴公司提供了可以替代HDFS横向扩展存储,很好解决了成本和带宽问题。比如Isilon的横向扩展存储方案,提供了3到144个节点的解决方案,可以扩展到15PB、每秒85GB吞吐能力,成为横向扩展存储的典型代表。

通过vSphere平台运行大数据

  VMware推出的BDE方案也在不断进步中,为各种不同版本的Hadoop运行提供了强大的支撑。目前BDE已经可以和vCloud Automation Center结合来提供Hadoop集群的自助创建,借助vSphere平台让最终用户可以快速自助创建应用,大数据的部署难题迎刃而解。大数据平台具有了自动化、自助服务能力,让大数据再也不是极客的专利,任何大数据应用的开发者、管理员都只需要专注自己的大数据应用本身,而无需关心底层的架构。

注:本文已经发表在《软件和信息服务》2014年8月刊上,如果想了解@云界漫步 对云计算的最新观点,请直接订阅“中国云梦”微信公众号。也可微信扫描下面的二维码,直接订阅。订阅”中国云梦“后,直接回复”20007“阅读该文。

大数据和云计算的鞍马情-【软件和信息服务】2014.08

时间: 2024-12-28 10:32:02

大数据和云计算的鞍马情-【软件和信息服务】2014.08的相关文章

虚拟化、大数据、云计算、物联网、移动互联网与传统互联网关系

<互联网进化论>一书中提出"互联网的未来功能和结构将于人类大脑高度相似,也将具备互联网虚拟感觉,虚拟运动,虚拟中枢,虚拟记忆神经系统" ,并绘制了一幅互联网虚拟大脑结构图. 根据这一观点,目前互联网最流行的四个概念-------------大数据.云计算.物联网.移动互联网与传统互联网之间的关系如下图.根据图中关系,网络将物联网.传统互联网和移动互联网的数据连接.汇聚在一起形成"大数据",这些数据经过人类刻意的.针对特意用途的分析产生价值用于决策分析等,

虚拟化、大数据、云计算、事、移动互联网和传统之间的关系网络

<互联网进化>一书中提出"功能和结构将于人类大脑高度相似,也将具备互联网虚拟感觉,虚拟运动.虚拟中枢.虚拟记忆神经系统" ,并绘制了一幅互联网虚拟大脑结构图. 依据这一观点,眼下互联网最流行的概念-------------大数据.云计算.物联网.移动互联网.传统互联网之间的关系例如以下图.依据图中关系,网络将物联网.传统互联网和移动互联网的数据连接.汇聚在一起形成"大数据".这些数据经过人类刻意的.针对特意用途的分析产生价值用于决策分析等,计算和分析的平

大数据、云计算和人工智能

原文链接:https://www.cnblogs.com/popsuper1982/p/8505203.html 最初这篇文章是在公众号上看到的,读了一个多小时,读完了感觉写的非常好,通俗易懂,为了以后还可以看到,就转到了自己的博客下. 一.云计算最初是实现资源管理的灵活性 我们首先来说云计算,云计算最初的目标是对资源的管理,管理的主要是计算资源,网络资源,存储资源三个方面. 1.1 管数据中心就像配电脑 什么叫计算,网络,存储资源呢?就说你要买台笔记本电脑吧,你是不是要关心这台电脑什么样的CP

大数据与云计算之间的区别与联系

大数据是什么? 在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的<大数据时代>中提出:大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理. 那么究竟多大的数据算是大数据,这个其实并没有明确的定义.不过IBM提出了大数据的5V特点:Volume(大量).Velocity(高速).Variety(多样).Value(低价值密度).Veracity(真实性).这也是目前大家比较公认的大数据的特征. 这个5V的特点,反映了大数据数据量大.产生的速度快且多样,同时大数据具有低价值密度的

大数据与云计算结合会有什么样的结果

生活中每天都会有大量的数据产生,有这么的多的数据到底有什么用呢?大数据时代,大数据和云计算的深度结合将有更多的新技术,新产品的出现. 大数据与云计算结合会有什么样的结果 大数据经典应用场景:无人机 现代社会,无人机已经是一项高科技的发明了.以前战争时代,打仗用的武器装备都是需要人来操控的.在现在这个时代,无人机是一个特别典型的创新.今天有了大数据,一切都在开始转变,在以前不能做的事情,云计算都是可以实现的. 大数据与云计算结合会有什么样的结果 数据是真实存在的 数据的存在很多的人已经看到了商业利

如何结合大数据与云计算?

你如何在大数据的海洋寻宝?对于那些拥有庞大数据信息需要处理的企业,在数据分析之前要克服的第一个障碍就是————不能够定位到相关并且有意义的信息. 你如何在大数据的海洋寻宝?对于那些拥有庞大信息需要处理的企业,在数据分析之前要克服的第一个障碍就是–不能够定位到相关并且有意义的信息.这也是HGST遇到的问题,HGST(日立环球存储科技公司)是一个计算机硬件的主要生产厂商,他们现在迫切需要追踪在生产设施上收集到的数据.据HGST的云计算与高性能解决方案主管David Hinz介绍,找到所需要的数据来评

大数据、云计算系统顶级架构师课程学习视频

本课程为大数据.云计算系统架构师高级培训课程,授课模式为线上视频+直播答疑,本套教程2000多节课,里面的hadoop.spark都是新版本 6个阶段共31部分:1.Linux基础2.大数据基础Hadoop 2.X3.大数据仓库Hive4.大数据协作框架5.分布式数据库HBase6.Storm流计算从入门到精通之技术篇7.Scala语言从入门到精通8.内存计算框架Spark9.Spark深入剖析10.企业大数据平台11.驴妈妈旅游网大型离线数据电商分析平台12.Storm流计算之项目篇13.某团

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程

38套大数据,云计算,架构,数据分析师,Hadoop,Spark,Storm,Kafka,人工智能,机器学习,深度学习,项目实战视频教程 视频课程包含: 38套大数据和人工智能精品高级课包含:大数据,云计算,架构,数据挖掘实战,实时推荐系统实战,电视收视率项目实战,实时流统计项目实战,离线电商分析项目实战,Spark大型项目实战用户分析,智能客户系统项目实战,Linux基础,Hadoop,Spark,Storm,Docker,Mapreduce,Kafka,Flume,OpenStack,Hiv

简述大数据和云计算

大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉.管理和处理的数据集合. 大数据的4V特点:Volume(大量).Velocity(高速).Variety(多样).Value(价值) 大数据技术可理解为在巨量的数据中提取到有用的部分加以分析和处理.例如,在某些电商中通过收集用户浏览或购买过的产品,向用户主动推荐用户感兴趣的产品. 大数据分析有五个方面:1.可视化分析:可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了. 2.