全面解析DDN存储和HPC解决方案

DataDirect Networks成立于1998年,是一家高性能存储产品的厂商,其提供的存储系统主要服务于大容量和高带宽应用。比如高性能计算领域,以及影片和视频的制作及分发等领域。HP也曾采用DDN作为其高性能计算解决方案的组成部分,IBM DSC9900 也是OEM自DDN的S2A9900。

DDN存储可以分为四种存储服务块设备、文件、对象以及计算存储融合;三个平台S2A、SFA、WOS。

S2A平台架构

S2A并行的架构提供Block存储服务,提供并行主机接口访问,后端并行读写,LUN跨多个Tier( 即Direct Raid技术);Tiers是一组磁盘的集合,而独特的Tier机制,提高LUN读写的并发性,提高单个LUN的性能。

每个Tier内部类似于Raid 3(8+1)或者Raid 6(8+2),Tiers之间类似于Raid 0实现数据可靠性。

除了Direct Raid技术,DDN有完善的电源管理方式,可以根据用户的需要对整个存储系统进行动态的磁盘休眠,这种休眠会更进一步减少电源的消耗。

SFA平台架构

SFA平台主要提供SAN和文件网关服务,该平台表明DDN已经从依赖硬件加速转向软件平台,相比S2A平台硬件,SFA平台无FPGA、无RAID卡,无Tiers,而是用Storage Pool概念,采用RAID 5、6、1代替RAID60。

基于分布式Cache和通过镜像通道转发,SFA通过镜像通道转发+Cache全镜像实现Active/Active。产品经历了SFA10KX, SFA12K-20/40, SFA12K-20E,下面是Storage Fusion Architecture (SFA)12KX规格,提供基于FC和IB的高性能存储设备,支持GRIDScaler Parallel File Storage System, EXAScaler Parallel File Storage System网关。12KXE(Embedded File Storage Appliance)可以把文件网关部署在控制器的VMs中。

WOS平台架构

支持4U高密度60插槽节点,3U 高性能16驱动 WOS节点,支持群集性能比例弹性伸缩,支持复制功能;提供HTTP、 PHP、 Java和 Python API,提供Put、Get、Delete等操作,支持400亿独特的对象,GUI配置和管理。

DDN文件网关

DDN网关基于SFA平台,分为NAS网关NASScaler,并行文件系统网关ExaScaler、GridScaler和SAN文件系统xStreamScaler/ MEDIAScaler。

在S2A平台架构上, 并行文件系统网关部署在服务器上;在SFA平台架构上,网关可以部署在服务器上,也可以部署在SFA-E平台内,后者是DDN主推的方式。

DDN文件网关ExaScaler/GridScaler设备

ExaScaler将Lustre的MDS、OST、OSS都部署在SFA-E的VM上,不需要额外物理服务器来部署Lustre平行文件系统。GridScaler将GPFS的NSD部署在SFA-E的VM上;同样,不需要额外物理服务器来部署Lustre平行文件系统。也可以通过物理网关的方式提供。

DDN文件网关 NASScaler设备

DDN提供三个版本的NAS Scaler系列产品:FAS-1596-GB,FSA-1506-10G和FSA-3192,产品有更新,产品更新以后抽时间在介绍。

NAS Scaler最大支持16个1U单元集群,单个集群最大提供2PB的容量;存储容量支持现有的S2A6620、 SFA10000。最大带宽15GB/s,每秒钟支持数十万次文件操作。

DDN文件网关xStreamScaler/ MEDIAScaler

xStreamScaler是DDN重要的一款产品,在媒资领域的解决方案较多。它是一款SAN 文件系统,同时也可以通过SAN直接访问后端存储(如Apple Xsan share filesystem),主要应用在媒资场景。

xStreamScaler还提供了HSM管理特性,如存储Tiers、Dedup等特性,无快照、远程复制特性。NAS Scaler仅仅是集群NAS,而不能通过SAN直接访问后端存储,xStreamScaler可以通过SAN直接访问后端存储。

如果仔细看看DDN产品家族,可以清晰看到,除了上述传统SAN、NAS、对象存储和针对HPC的专业存储外,DDN也是紧跟闪存步伐,推出针对HPC场景的Flash存储系统,FlashScale AFA和加速产品IME Burst Buffer。

Infinite Memory Engine

IME采用新的I/O供给模式,作为Burst Buffer加速产品,在软件定义存储、计算中间引入了一个全新的新、透明,可扩展,非易失性存储器的存储层,提供低延迟、高带宽和IOPS性能。满足下一代性能消耗科学分析和大数据应用场景。

通过IME设备智能缓存或预读数据,可以提供计算峰值业务负载要求,分离峰值和平稳业务性能需求,降低存储在满足峰值业务诉求的投资。

IME屏蔽由小文件I/O和文件锁定引起的动态地将分段数据对齐成满条带写入的POSIX语义并行文件系统的限制。从下图可以看到,基于S3D湍流模型,计算节点可以同时从IME或从并行文件系统中读取数据,实际上,在计算节点中预先编译安装了DDN提供的并行技术接口和智能数据预期算法,他可以根据数据访问来判断预期下一刻需要访问的数据,并加速到IME中提高带宽性能,当对存储带宽要求不高时,可以直接从并行文件系统读取数据。

IME满足软件定义存储特性,我们基于软件的方法提供了更多的灵活性选择,从DDN官方材料来看,IME跟并行文件系统、技术节点、网络、HPC应用和部署方式等都是完全解耦,具备很强的通用性。

从下面规格可以看出,IME产品基于NVMe协议、支持800G和1.6T SSD磁盘,提供POSIX文件访问接口,支持Scale out到32个节点,整个系统支持1.6TB*48*32存储容量。

IME交付方式包含IME14KX、 IME240和纯软件产品和基于存软件方式,DDN提供了一种软件定义防止厂商锁定的交付模式。

IME14KX基于超融合DDN SFA14KX硬件平台,利用业界最新的组件最大限度地提高I/O性能。利用多核处理器,互连和内存技术。集成了业界最广泛的PCIe非阻塞架构。每个IME14KX都可以扩展到48NVMe SSD,在每个4U设备可以扩展到50GB/s带宽。

IME240使用标准的2U商用存储服务器机箱,通过优化以消除I/O性能阻塞组件,并添加超低延迟InfiniBand连接。相比IME14KX,IME240实现小规模IME I/O加速,其一个Building Block可以提供的20GB/s带宽。

在HPC计算场景中,Burst Buffer技术主要解决下面三个问题。 1.将随机小IO汇聚成串行大I/O,后续再顺序或以大IO写入HDD的并行文件系统,提供小IO或小文件读写性能。 2.消除浪涌型IO性能瓶颈,减小IO在高峰计算的时延。 3.数据智能预取和读写加速。

FlashScale产品

DDN宣传是世上最快、成本最优的AFA。Flashscale利用近二十年的DDN的规模经验和平台演进,为世界上最数据密集型超级计算,物联网超级计算器和企业级规模站点提供动力。

在4U设备中,提供极高的600万IOPS和60GB/s带宽,在一个40U的机柜中可提供高达60百万IOPS和600 GB/s。利用最新的NVMe和SAS接口或混合SSD接口技术,基于高密度超融合,共享存储架构,在4U的空间中提供576TB容量,一个机架中支持7.3PB容量。

支持Scale up扩展容量,Scale out扩展性能。提供最佳性价比,应用于生命科学,制造,石油和气体,政府,Web规模,分析,数据库和HPC环境。支持Lustre和 IBM Spectrum Scale(GPFS)并行文件系统。

Flashscale采用商用硬件和NVMe&SAS SSD技术,并采用融合架构,融合存储和并行文件系统计算节点,4U控制框包含72块高密磁盘,2个冗余计算节点(4U Active/Active Storage Appliance,2 Compute Controllers: 4 x 18-core Intel CPUs, Up to 2048GB DDR4-2400Memory),FC、IB、100Gb以太网和DDN OmniPath网络。

Flashscale基于SFA OS 3.0软件平台,支持增加JBOD(SS8412扩展框)的方式扩展容量(支持1到10个),或扩展基本存储框来增加性能。

前一段时间我们还在讨论全SSD的NAS使用场景,详情请参看PureStorage和NetApp推新品Flash NAS场景在哪里。看完这篇文章你会发现,其实HPC就是全SSD NAS最典型的的应用场景,因为像很多仿真、时延、新科学计算都要求全网无阻塞数据访问,眼下也只有SSD能要满足大带宽、低时延的要求。所以春江水暖鸭先知,DDN、Xyrate(详情参考文章不谈DSSD谈谈Xyrate和希捷)等专注于HPC领域的厂商率先推出自己的全SSD的HPC产品和解决方案。搜索“ICT_Architect”加入微信公众号“架构师技术联盟”获取更多精彩内容。

时间: 2024-10-10 16:32:18

全面解析DDN存储和HPC解决方案的相关文章

爬虫代码实现三:打通爬虫项目的下载、解析、存储流程

1.新建一个存储接口IStoreService package com.dajiangtai.djt_spider.service; import com.dajiangtai.djt_spider.entity.Page; /** * 数据存储接口 * @author Administrator * */public interface IStoreService { public void store(Page page);} 2.新建一个存储接口实现类ConsoleStoreService

解析数据存储MySQL

为了适应不同项目对不同感兴趣属性的解析存储,数据存储结构采用纵向的属性列表方式,即一个url页面多个属性存储多条记录方式,并且按照text,html,data,num几大典型类型分别对应存储. 创建UTF-8字符集的nutch数据库,并执行表初始化脚本,参考DDL: CREATE TABLE `crawl_data` ( `url` varchar(255) NOT NULL, `code` varchar(255) NOT NULL, `name` varchar(255) DEFAULT N

SharedPreferences存储复杂对象解决方案

对于复杂的对象存储android sdk本身没有提供相关api,如果想通过xml节点表示复杂对象在解析这块花的功夫就比较大了,于是找到一个简单方法,那就是用base64存储序列化的对象按string类型存储你懂的. 一下是我在项目中用到的实测过的代码: /** * SharedPreferences工具类 * * @author bobby * */ public class SharedPreferencesUtils { Context context; String name; publi

mysql 海量数据的存储和访问解决方案

第1章  引言 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题.对于一个大型的互 联网应用,每天几十亿的PV无疑对数据库造成了相当高的负载.对于系统的稳定性和扩展性造成了极大的问题.通过数据切分来提高网站性能,横向扩展数据层已 经成为架构研发人员首选的方式.水平切分数据库,可以降低单台机器的负载,同时最大限度的降低了宕机造成的损失.通过负载均衡策略,有效的降低了单台机 器的访问负载,降低了宕机的可能性:通过集群方案,解决了数据库宕机带来的单点数据库不能访问的问题:通过读写

解析CEPH: 存储引擎实现之一 filestore

Ceph作为一个高可用和强一致性的软件定义存储实现,去使用它非常重要的就是了解其内部的IO路径和存储实现.这篇文章主要介绍在IO路径中最底层的ObjectStore的实现之一FileStore. ObjectStore ObjectStore是Ceph OSD中最重要的概念之一,它封装了所有对底层存储的IO操作.从上图中可以看到所有IO请求在Clieng端发出,在Message层统一解析后会被OSD层分发到各个PG,每个PG都拥有一个队列,一个线程池会对每个队列进行处理. 当一个在PG队列里的I

Oracle导dmp出现文件ORA-12154: TNS: 无法解析指定的连接标识符解决方案

其实TNS无法解析是Oracle操作里经常遇到的问题,原因有二: (1)Oracle服务器没有装好(一般不建议重装,因为Oracle卸载不完全是没法重装的) (2)TNS没有配置 现在本博客给出解决方案: 现在先测试一下tns是否可以ping,成功的界面大致如下 (1)在oracle安装路径的tns配置文件里添加如下代码 # tnsnames.ora Network Configuration File: d:\Oracle\product\10.2.0\client_1\NETWORK\ADM

用wireshark解析应用层存储包

工作中经常需要统计服务器上的rtp包接收.发送性能.不想自己再做一套统计软件,打算用现有的wireshark来做分析统计. 先把rtp头存成pcap格式文件,pcap文件格式及怎样存储可以参照这篇文章http://blog.csdn.net/force_eagle/article/details/6681802 然后在wireshark中打开pcap文件,但是问题来了,在wireshark中默认只支持完整的ip报文.这样需要在每个rtp包前加上ip头,可是ip头的大小比rtp头都还要大,这样做会

解析云存储上绑定域名的简单操作

1.登陆猫云控制台,点击云存储功能按键选择您想要绑定的资源池. 2.进入资源池后,选择绑定域名页面,点击添加域名并输入您想要绑定的域名. 3.添加绑定域名后,系统会进行部署,处理时间5-10分钟. 4.在系统处理域名期间,我们可以去dns服务商那里进行资源池绑定域名的CNAME解析. 5.上传完资源后点击复制外链,因当前版本的外链是默认系统提供的域名来调用的,所以要进行修改成自己绑定的资源池域名来进行调用. 6.当系统部署完资源池绑定的域名后,我们就可以用绑定的域名来调用资源了. 原文地址:ht

2.zookeeper原理解析-数据存储之Snapshot

=====================================斩秋|http://blog.csdn.net/quhongwei_zhanqiu======================================= Snapshot是datatree在内存中某一时刻的影像,zookeeper有一定的机制会定时生成datatree的snapshot.FileSnap实现了SnapShot接口负责将数据写入文件中,下面我们来看看snap相关内容. 2.1 snapshot文件格式