XIV(3)--Read/Write Operations

XIV系列:

XIV(1)—Hardware Overview

XIV (2)--Logical system concepts

之前的文章曾经说过HOST发过来的data会在XIV上存2份,即Primary Copy和Secondary Copy。只有当这2份都同时存在时,系统才是Full Redundancy状态。那主机在XIV上读写数据分别是怎么进行的呢?请看本篇:

-Each write is written to the cache of two data modules// 每个写操作是先写到2个Data Module中的Cache中的

-Host is acknowledged as soon as two cache copies are available //只有当两份Cache都写完时才会发送一个Acknowledge给Host

-De-staging to the disk drives takes place: //至于什么时候将cache中的数据Flush到Disk上是各个Module独立进行的

–In the background

–Independently on each module

  Write Operation Overview

1.Host sends write to interface

2.Interface sends write to primary data module

3.Primary data module sends write to secondary data module

4.Host is acknowledged only after write is completed on both modules

上图只是讲述了Host写数据操作的大致步骤,涉及到XIV内部具体是怎么进行的呢?

Write Operations

1, Host sends a write request to one of the i_nodes

2, i_node consults with the Slice Table, determines primary node ID and disk #

3, i_node forwards request to relevant module’s primary cache node

4, Primary cache node consults with the Slice Table, forwards request to the secondary cache node

5, Both cache nodes consult with their local Partition Table to determine physical location on disks

6, Both cache nodes save the written buffer in their memory cache

7, Secondary cache node send an ack to the primary cache, which then acks the i_node, which then acks the host

这里有两个Table,Slice Table和Local Partition Table。一个负责整套XIV的元数据,一个是负责盘上面的。可以看出所有的涉及到写到哪个Node的具体哪块Disk时,是要查询Slice Table。而最后写到Disk上哪块Block上时,是查询Local Partition Table的。

看完写操作,再来看读操作。

Read Operations

1, Host sends a read request to one of the i_nodes

2, i_node consults with the Slice Table, determines primary node ID and disk #

–A read request will always be directed to the primary copy of the data

3, i_node forwards request to relevant module’s cache node

4, Cache node consults with its local Partition Table, determines physical location on disk

5, Cache node reads the data from the memory cache, if there, or from the disk

6, Cache node sends data to i_node, which gives it to the host

同样地,读操作也涉及到Slice Table和Local Partition Table。

看到这里,我感觉和我之前接触到的分布式文件系统(Distributed File system)非常类似,例如MooseFS,Google的GFS,Hadoop File System等等。有机会在深入研究之后对比下两者实现方式的异同点。

时间: 2024-11-08 21:41:15

XIV(3)--Read/Write Operations的相关文章

XIV(1)—Hardware Overview Cont.

接第一篇<XIV(1)- Hardware Overview>讲述了XIV系统的大体的硬件组成,本篇继续讲XIV系统的Hardware Architecture. 1,Data Module/Interface Module XIV Model A14 Data Module/Interface Module Data Module和Interface Module的区别在于Interface Module有主机IO适配器和G网卡适配器,还有就是Data Module是一个Low voltag

XIV(4)--Flash caching

1,Flash Cache简介 Flash cache 本身是Facebook的一个开源项目,(准确的说是一个Linux的模块),可以动态加载.Flashcache通过在文件系统(VFS)和设备驱动之间新增了一次缓存层,来实现对热门的缓存.Flashcache是另一种缓存,一般用SSD作为介质的缓存(一般的缓存用的是内存),通过将传统硬盘上的热门数据缓存到SSD上,然后利用SSD优秀的读性能,来加速系统.这个方法较之内存缓存,没有内存快,但是空间可以比内存大很多.如下图: 现在很多硬件厂商也会在

2016年中国大学生程序设计竞赛(杭州)1006 Four Operations

Four Operations Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 38    Accepted Submission(s): 18 Problem Description Little Ruins is a studious boy, recently he learned the four operations! Now

XIV (2)--Logical system concepts

先来看看几个XIV中最基本的概念: Partitions     The fundamental building block of a logical volume is known as a partition. Partition是1MB(1024KB),包括a primary copy 或者 secondary copy of data,每个Partition都对应一个单独的物理磁盘的某个区域,存储管理员不知道也无法控制一个Partition对应到哪个disk,它是由系统算法控制的.Se

XIV(1)&mdash;Hardware Overview

IBM XIV被业内称为革命性的新一代存储架构,它是采用了大规模并行的分布式网格存储技术,使用了"Scale out"(横向扩展)的存储架构,利用多路网格模块并行分担存储负荷,并通过细粒度数据分布算法保证数据的恒定均衡分布,它不但提高了系统的可靠性.可用性和存取效率,还易于扩展. 1,System models and components Machine type 2812-A14    Machine type 2810-A14     Machine type 2812-114

XIV(5)-- Data Recovery Protection (XDRP)

和大多数存储系统一样,XIV也提供多地容灾的解决方案.XIV Data Recovery Protection (XDRP)有三种实现方式, Synchronous Mirroring; ASynchronous Mirroring; Data Migration.除此之外,当然也支持Flashcopy,VolumeCopy 一.Synchronous Mirroring XDRP是在两个或多个XIV系统之间做real-time copy,支持 Fiber Channel 或iSCSI link

XIV(1)- Hardware Overview

IBM XIV被业内称为革命性的新一代存储架构,它是采用了大规模并行的分布式网格存储技术,使用了"Scale out"(横向扩展)的存储架构,利用多路网格模块并行分担存储负荷,并通过细粒度数据分布算法保证数据的恒定均衡分布,它不但提高了系统的可靠性.可用性和存取效率,还易于扩展. 1,System models and components Machine type 2812-A14 Machine type 2810-A14 Machine type 2812-114 Machine

安装Operations Manager代理程序(1)

Operations Manager"代理"是安装在计算机上的一项服务.代理会收集数据.将采样数据与预定义的值进行比较.创建警报并运行响应. 管理服务器会接收配置并将配置分发到受监视的计算机上的代理. 你可以使用一些方法在计算机上安装 Operations Manager 代理. (1) 可以在操作控制台中使用发现向导,有时也称为"请求安装". (所有其他方法均被认为是手动安装.) 此方法适用于运行 Windows.UNIX 和 Linux 操作系统的计算机. (2

ORACLE AUTOMATIC STORAGE MANAGEMENT翻译-第十章ASM内置数据结构(2)

Free SpaceTable(FST) FST指明了ATB中包含的空闲空间.当磁盘被选择分配时ASM会生成一个磁盘FST.这个允许ASM跳过被ATBs占用的空间.FST包含每个ATB的条目.每个条目描述了extents size的总数和空闲extents.FST的目的是优化分配操作.事实上FST位于AllocationTable中.FST位于每个AT的第二个block(block 1). PartnershipStatus Table(PST) PST跟踪磁盘组资格和磁盘间的配合关系.ASM生