IBM Storwize V7000 Introduction(1)

先看一段来自redbook的Strowize V7000的定义:An IBM Storwize V7000 system is a clustered, scalable, and midrange storage system, and an external virtualization device.

V7000最大的卖点是Virtualization。所谓的存储虚拟化是将不同厂商的存储设备放到一个Pool里以便统一管理,例如下图Storwize V7000(SVC)后面可以接IBM的DS8000,XIV,NetApp,EMC等其他厂商的设备。将这些设备的所有存储空间放到一个大的Pool里,跨设备之间做copy service,Data Migration。对后端存储做操作时对前端主机是透明的,因为前端host只看到一个Storwize V7000(or SVC)。

说到虚拟化,IBM除了Storwize V7000,还有SVC(SAN Volume controller)。两者运行的code都是一样的,只不过一个是作为Server(SVC),一个是作为Storage(Storwize V7K)。下图是一套Storwize V7000系统的组成部分,类似于DS3K/4K/5K,它也分Control Enclosure和Expansion Enclosure。

再看看Storwize V7000的硬件,Front view和Font view,硬件外观上看上去和DS3512很像,只不过Storwize V7000中叫做Node Canisters,而DS3512叫做Controller。每个Storwize V7000有一个或两个(optional)control enclosures,每个control enclosure都包括两个node canisters,磁盘及两个PSU。

重要的术语:


Control enclosure


A hardware unit that includes the chassis with a midplane for connection of node canisters, drives and power supplies with batteries.


Node canister

【类似于DS5K的Controller】


A hardware unit that includes the node electronics, fabric and service interfaces, serial-attached SCSI (SAS) expansion ports and direct connections to internal drives in the enclosure.


Expansion enclosure


A hardware unit that includes the chassis with a midplane for connection of expansion canisters, drives, and power supplies without batteries.


Expansion canister

【类似于DS5K扩展柜的ESM】


A hardware unit that includes the electronics to provide serial-attached SCSI (SAS) connections to the internal drives in the enclosure and SAS expansion ports for attachment of additional expansion enclosures.


Cluster


Two node canisters in a control enclosure.


Managed Disk (MDisk)


A SCSI logical unit (aka LUN) built from an internal or external RAID array.


Storage pool


A collection of MDisks providing real capacity for volumes.

SVC: Managed Disk Group (MDG)


Volume


What the host operating system sees as a SCSI disk drive.

SVC: Virtual Disk (VDisk)

Cluster    
Cluster由2个到8个node canisters组成,所有的配置,监控和服务进程是在Cluster level执行,configuration 是copy在Cluster里的所有node canisters上。Cluster只分配一个IP而不是每个node一个IP。其中一个Node会被选出成为“configuration node canister”,它是唯一一个来activate Cluster IP的node。如果这个node fail了,会重新选出新的“configuration node”,新的“configuration node”会接管这个IP。

I/O Groups:一组Node canister称为I/O group。

正常情况下,某个Volume的IO都是由I/O group里的同一个Node处理的。和DS3K/4K/5K一样,一个Volume也只有一个Preferred Owner(A控orB控,Node1orNode2),两个Node是以failover mode模式工作,即一个Node down掉时,另一个Node可以继续工作,而对主机没有impact。

一个Node就是一个SVC(SAN Volume controller),是个运行Linux的X Series服务器,提供虚拟化,copy service。两个Node组成一个Cluster。一个Cluster可以有1-4个Node paris。每个pair都是一个IO Group。IO group在配置Cluster的时候定义。每个Node只能在一个IO group里。

Managed Disk (MDisk)

Host端不会看到Managed disk,相反,他们看到的是Logical disks,也被称为Virtual disks。Managed disks再组成managed disk groups。组成Virtual disks的Managed disk必须来自同一个Managed disk group。每个Managed disk被分成多个Extents(默认16MB),从0开始,一直到Managed disk的结束。

Quorum disk可以是一个Mdisk或者是Internal Drive,是一个保留区域以用于Cluster管理,用于决定哪一半Cluster继续读写数据。Cluster system在Mdisk上占据很少的空间来自动生成Quorum disk。为了冗余,将Quorum disk存在三个不同的Mdisk上,但只有一个Quorum disk是Active的。在V7K,Internal drive可以被认为是Quorum candidates。如果一个环境里有多个存储,那为了避免单个Storage坏掉而丢失Quorum disk,应该把Quorum disk分散在多个存储上。

Quorum disk是来决定当Cluster中的一个node offline 时,哪个node继续工作。In this tie-break situation, the first group of nodes that access the quorum disk marks their ownership of the quorum disk and as a result continues to operate as the cluster. If the other group of nodes cannot access the quorum disk or finds it owned by another group of nodes it stops operating as the cluster and does not handle I/O requests.

看下一个write request是怎么在V7000中完成的:

创建Vdisk时就已经define了preferred node,在上图中即node1,正常情况下所有对V1这个Vdisk的读写操作都是由node1完成的。

通过Node1 对Vdisk V1进行写操作请求(1),write data会copy一份到node2里,然后才会给主机返回一个写完成操作(2)。之后,node1会将cache数据destage到disk

总结:写操作时,处理IO的Node会将数据copy一份到IO group里的另一个Node,然后才会给主机返回一个write completion。读数据时,和其他storage一样,preferred node会先检查cache中有没有data。如果没有就从磁盘中读。如果IO group里的一个node fail了,另一个node会立刻接管过来,由于write data是在两个node之间mirror的,所以这种node failure不会造成data loss。Surviving node会将cache里的数据destage到disk并进入write-through mode,即所有write data直接写到disk而不经过cache。

时间: 2024-11-16 13:53:41

IBM Storwize V7000 Introduction(1)的相关文章

运维文档分享(3):V7000存储运维使用手册

前言:最近整理电脑,发现之前写的几篇生产上的运维测试文档,特来分享. 一.    IBM Storwize V7000简介    IBM Storwize V7000 适用于中端市场,它通过内置的自动精简配置.Easy Tier 自动存储分层和存储虚拟化,满足了虚拟环境中性能和效率问题.新的 Storwize V7000 Unified 可以支持文件和块存储,并利用完全集成的管理功能来处理非结构化数据的大规模增长,而无需其他存储纵向结构.Storwize V7000 和 Storwize V70

架构设计:系统间通信(27)——其他消息中间件及场景应用(上)

1.概述 目前业界有很多消息中间件可供大家选择,主要分为两类:需要付费的商业软件和开源共享的非商业软件.对于商业软件您和您的团队可以选择IBM WebSphere集成的MQ功能,也可以选择Oracle WebLogic集成的MQ功能.本文首先介绍除Apache ActiveMQ以外的两款开源共享的消息中间件产品,然后列举三个实际的业务常见,为读者介绍如何在这些实际业务中使用消息中间件解决问题. 2.RabbitMQ及特性 RabbitMQ基于Erlang语言开发和运行.它与Apache Acti

架构设计:系统间通信(35)——被神化的ESB(下)

(接上文:<架构设计:系统间通信(34)--被神化的ESB(上)>) 2-4.ESB与版本控制 企业中的系统集成过程,存在很多非技术因素引起的变化.可能出现的情况是,某个一直能够正常使用的调用功能A,在某一天突然就不能使用了.技术团队和业务团队排查了许久才发现功能A中对某个业务系统的调用接口已经被私自更改(可能只是多传递了一个参数.或者减少了一个参数的传递).这种情况在现实中经常出现,可能是业务部门出于私利对外屏蔽了这个接口,也可能是技术人员在改动接口时,忘记了这个接口还有外部系统进行使用.

Windows Server 2012 虚拟化实战:存储(二)

五.搭建Window Server 2012虚拟化的存储网络 前文我们讨论了Window Server 2012支持的各种与存储相关的技术,接下来我们通过实践对其中的一些技术进行检验.实际上Window Server 2012虚拟化并不一定需要诸如NAS或者SAN之类的第三方存储,利用服务器的内的本地磁盘也同样可以部署Window Server 2012虚拟化的基础架构SCVMM(System Center Virtual Machine Manger).但是虚拟化本质上追求的是可伸缩性和高可用

Flume官方文档翻译——Flume 1.7.0 User Guide (unreleased version)(一)

Flume 1.7.0 User Guide Introduction(简介) Overview(综述) System Requirements(系统需求) Architecture(架构) Data flow model(数据流模型) Complex flows(复杂流) Reliability(可靠性) Recoverability(可恢复性) Setup(配置)Configuration(配置 Setting up an agent(设置一个agent) Configuring indiv

(转)如何写好英文科技论文

英文科技论文写作是进行国际学术交流必需的技能.一般而言,发表在专业英语期刊上的科技论文在文章结构和文字表达上都有其特定的格式和规定,只有严格遵循国际标准和相应刊物的规定,才能提高所投稿件的录用率.    撰写英文科技论文的第一步就是推敲结构.最简单有效的方法即采用IMRaD形式(Introduction,Materials and Methods,Results,and Discussion),这是英文科技论文最通用的一种结构方式.         IMRaD结构的逻辑体现在它能依次回答以下问题

蓝的成长记——追逐DBA(18):小机上WAS集群故障,由一次更换IP引起

原创作品.出自 "深蓝的blog" 博客,欢迎转载,转载时请务必注明出处.否则追究版权法律责任. 深蓝的blog:http://blog.csdn.net/huangyanlong/article/details/47720043 [简单介绍] 个人在oracle路上的成长记录,当中以蓝自喻.分享成长中的情感.眼界与技术的变化与成长.敏感信息均以其他形式去掉,不会泄露不论什么企业机密,纯为技术分享. 创作灵感源于对自己的自省和记录.若能对刚刚起步的库友起到些许的帮助或共鸣,欣慰不已.

Android Gradle Plugin指南(一)——简介

原文地址:http://tools.android.com/tech-docs/new-build-system/user-guide#TOC-Introduction 译者:google推出了全新的Android Studio集成开发环境,其中Android项目的结构与Eclipse的Android项目结构有很大的区别,原因就在于两开发环境使用的构建工具不同.Android Studio使用Gradle构建工具,Eclipse的ADT插件使用的是Ant构建工具.因为两个构建工具的区别,导致习惯

(译)IOS block编程指南 1 介绍

Introduction(介绍) Block objects are a C-level syntactic and runtime feature. They are similar to standard C functions, but in addition to executable code they may also contain variable bindings to automatic (stack) or managed (heap) memory. A block ca