前一篇讲到vSphere套件是VMware的SDC,NSX产品是VMware的SDN。本文介绍软件定义的数据中心中另一个核心组件——存储。
软件定义的存储,SDS
软件定义的存储,或者存储虚拟化,是继网络虚拟化之后的又一个热点话题。软件定义的存储是指通过智能软件加上廉价的x86服务器来实现以前只能在传统存储厂商的存储阵列中提供的特性,例如数据的去冗余,数据复本,精简创建,快照和备份恢复等,同时提供策略驱动的简单管理接口,摒弃了传统存储厂商各自不同的管理接口。
实现软件定义存储设计的是VMware在2014年推出正式版的VirtualSAN,和vCenter Site Recovery Manager。
在传统的vSphere部署环境中,vSphere几乎所有的高级特性,例如vMotion,High Availability,Fault Tolerance都依赖外部存储阵列才能完成。如今,Virtual SAN(以下简称vSAN)提供一种与vSphere完全集成的新的VMware存储解决方案。基于嵌入在vSphere内核中的聚合了存储虚拟化管理程序的分布式体系结构,vSAN可以将多个主机的本地磁盘虚拟化成一个共享存储空间,从而提供以前只能使用存储阵列才能提供的vSphere的高级特性。而且,因为vSAN的分布式存储架构,使得扩展存储容量变得异常简单。用户可以通过向集群中添加主机或者向主机中添加磁盘,达到无中断的轻松扩展vSAN数据存储的容量。
举一个简单的例子,假设企业A想部署一个基于vSphere的小型虚拟化平台作为上海分公司的IT基础架构。除了要采购5台x86的服务器外,还需要采购存储厂商的中低端存储,用来开启vSphere的高级特性给企业应用的不间断服务提供保障。目前存储厂商的存储阵列都十分的昂贵,无论是NetApp的FAS系列存储,IBM的DS系列,还是EMC的VNX系列产品,入门级都要80,000人民币以上。相比10,000人民币左右的服务器和1,000人民币每块的2TB企业级SATA硬盘来说,8万人民币起步的存储阵列就是天价!而且,因为IT部门已经采购了VMwarevSphere作为自己的虚拟化平台,它只需要开启嵌入在vSphere内核中的vSAN,就能将x86服务器主机中的本地硬盘虚拟化成一个共享存储空间,不需要采购额外的存储阵列了。同时vSAN内置了分布式容错系统和缓存镜像来确保在发生磁盘、主机或网络故障时绝不会丢失数据。这样就能够在保证企业应用不间断的前提下,极大的降低了企业部署IT基础架构的成本。
这里也有一个介绍vSAN的视频短片,帮助大家理解vSAN。http://bcove.me/na8m6jyp
存储和可用性总是在一起的,我们前面讲到了软件定义的存储就不能不提到软件定义的可用性。软件定义的可用性产品就是我们现在要讲到的vCenter Site Recovery Manager(以下简称SRM)。SRM是基于vSphere平台的领先的灾难恢复管理解决方案。它与vCenter和vSphere Replication无缝集成,为集中式恢复计划提供自动化编排和无中断的测试,从而极大的简化了虚拟化应用的灾难恢复管理。
为什么SRM比存储厂商提供的备份恢复解决方案更好?
1. vSphere Replication是VMware的专有复制引擎,它仅将发生变更的数据块复制到恢复站点。与存储厂商简单的全系统虚拟机复制相比,此方法可以减少带宽占用量,并实现更灵活高效的恢复策略。
2. SRM运用智能软件提供的简单、集中化的恢复计划替代复杂的面对存储阵列的人工操作。同时,除了灾难发生后的能够进行恢复实施外,SRM还允许IT部门在正常工作时间外进行灾难恢复的测试,从而极大的降低了灾难真实发生后,恢复实施的成本。
举个简单的例子,假设企业A是一家物流和供应链服务公司,它运维了两个数据中心。上海的数据中心是生产环境,负责企业运营所必须的应用系统,例如基于web的运单跟踪系统,和仓库管理系统,而广州的数据中心是基础架构的备份中心。IT部门明白硬件服务器的失效是不可避免的事实,而任何宕机事件都将对业务产生巨大的损失。所以,IT部门采用的传统的方式每个月备份上海数据中心的虚拟机文件和相关的核心数据库文件、核心文件服务器文件到广州数据中心。但是,这样的操作不仅耗时,而且数据也有一定的滞后性。即使数据是完整的,如果上海数据中心发生灾难,IT部门也很难在短时间内在广州数据中心完全恢复企业运营的应用系统。因为网络的设置是不一样的,存储的设置是不一样的,应用系统的各个模块启动先后顺序还有依赖的。这就使得IT部门在面对真实的灾难发生时,需要花费相当长的宕机时间,在广州数据中心恢复企业运营所必须的应用系统。
而SRM却能轻松的解决这个问题。因为,在真实的灾难发生之前,数据中心管理员就可以在SRM的软件中定义恢复的计划,并且,可以定义应用系统各个模块间的依赖关系。例如,需要停止运单跟踪系统,必须先关闭前端的web服务器,接着是数据库服务器,然后是文件服务器,最后是ESXi的主机。当在两个数据中心之间启动SRM后,vSphere Replication仅将上海数据中心中发生变化的数据块复制到广州数据中心,这就极大的降低了网络带宽的占用量,而且能实现更灵活高效的恢复策略。同时,SRM还允许IT部门在不影响生产环境的情况下,测试灾难恢复的计划,从而使得灾难恢复计划不断的成熟和完善。因为,灾难恢复计划已经在SRM中详细而严谨的定义完成,所以,当真实的灾难发生时,数据中心管理员只需要轻点鼠标就能轻松的将应用系统从上海数据中心迁移到广州数据中心,从而最小化应用服务的宕机时间。
这里也有一个介绍SRM的视频短片,帮助大家理解SRM。http://bcove.me/1e6ks8km
下一篇我会介绍软件定义的管理和VMware混合云的产品,敬请期待。
作者简介
谢品
VMware存储和可用性事业部研发经理
现担任VMware存储和可用性事业部研发经理,致力于软件定义的数据中心系统研发工作,对虚拟化、云计算、分布式对象存储系统和大数据等企业产品、技术方案有深入的理解和实战经验。在此之前,就职于EMC从事分布式对象存储系统的研发工作。
VMware交付的软件定义的数据中心 - SDS,布布扣,bubuko.com