分布式网格缓存Coherence简介

Coherence企业级缓存(一) 特点

摘要:Oracle Coherence是一个企业级的分布式集群缓存框架。具有自管理,自恢复,高可用性,高扩展性等优良特点,在电信BOSS等项目中有很大的应用价值。本文对它的特点,架构,基本使用方法,JMX管理,调优等进行简要但快捷的介绍,并对于Hibernate的集成过程进行说明,为BOSS,CMP等移动项目提供一个的参考。 
关键词:分布式缓存 Coherence

网上除了官方用户指南,关于Coherence的介绍文章资料很少,因此总结出此文,从原理到快速指南和基本最佳实践,希望对需要的人提供一个参考。 
1 Coherence 概述 
1.1 Coherence是什么 
Oracle官方网站的描述是:Coherence 在可靠的、高度可伸缩的对等集群协议之上提供了复制的、分布式的(分区的)数据管理和缓存服务。Coherence 不存在单点故障,当某台服务器无法操作或从网络断开时,它可以自动且透明地进行故障切换并重新分布它的集群化数据管理服务。当新服务器加入或故障服务器重 启时,它会自动加入集群,Coherence 会将服务切回到该服务器,透明地重新分布集群负载。Coherence 包含网络级的容错特性和透明的软重启功能,以支持服务器自我修复。 
----来自Oracle Coherence 专区 
http://www.oracle.com/technology/global/cn/products/coherence/index.html

一个典型的Hibernate应用 + Coherence集群如下图所示: 

1.2 Coherence的特点 
1.2.1 分布式集群缓存 
Coherence是一个分布式的缓存方案,并且通过集群为应用提供强大的缓存后备支持。Coherence主要是内存缓存,即存储区域主要在内存当中。 
与一般的分布式缓存方案如JBossCache, Memcache 等相同,分布式缓存的价值基于网络IO性能高于DB查询的磁盘IO性能这样一个特点。 
Coherence所有的设计都是基于多个(可以是非常多)的JVM,很多Coherence的测试都是使用几十甚至上百个节点来进行的。 
下图展示了一个典型的WAS项目架构:WAS集群 + Near型Coherence集群架构。对于大型Web2.0网站(PHP或其他),集成Coherence也是类似的。 

1.2.2自管理 
Coherence使用的网络协议是TCMP ,是对UDP,TCP/IP的组合使用。Coherence能将启动的实例节点(Node)自动组成为集群(Cluster)。在一个局域网环境中,通过多播(Multicast)机制,第1个启动的Node能自动发现后启动的Node,第1,2个Node同样能发现之后启动的其他Node,依次类推,自动组成集群; 并且也能自动检测到死亡节点。集群各节点间通过单播(Unicast)机制进行数据复制,同步及发送通知消息。 
Coherence集群以统一的逻辑试图对外提供缓存的读写接口,看起来使用Coherence Client就像在使用一个缓存一样。

1.2.3 自动容错和恢复 
基于自管理的特点,一个Node挂掉后,集群能自动监测到,并做好死亡节点的数据恢复机制,客户端依然能正确的读出在死亡节点上存储的数据,容错和恢复对客户端来说是透明的。

1.2.4 分区缓存(Partitioned Cache) 
这是Coherence与众不同的地方。一般集群如:JBossCache, Websphere 集群等,每个Node都有数据的完整拷贝,Node间通过复制来实现数据同步和一致性,一般来说采用全复制模式,即一份数据在各节点上都有一份拷贝。这种模式下,节点要存储了较多的数据,同步复制时比较消耗网络带宽。 
而Coherence的分区缓存只将一个Node上的数据在另一节点上做1个备份,有效降低复制的消耗好时间,并节省内存总需求,只需复制模式的1/N (N为缓存节点个数)。

1.2.5 线性扩展 
假如你的Coherence集群已经有4个Node,当系统数据量过大引起Cache容量满员,导致缓存性能下降时,可以通过启动新的Node来扩容,改善集群的性能。 
这一点也是源自分区缓存技术,集群有N个Node,每个Node只存放1/N的数据,这种设计让Coherence能够处理非常多的数据,只需要通过增加节点的数量,就可以处理更多的数据。 
下图为例,当两台机器,4个存储Node不够用时,通过新增机器,新增Node实例即可自动加入集群,提升Coherence缓存性能。  

线性扩展更重要体现在性能上,下图展示了,Coherence集群通过增加机器,增加Node实例使得交易耗时大幅降低,而且随着集群规模呈线性下降。 

1.2.6易用性 
虽然上述特点看起来似乎很复杂,但那都是Coherence自己内部的事儿。对于客户端来说,与最简单的Map 操作一样,仅仅是 put(key,value), get(key) 等。

Java代码  

  1. NamedCache cache = CacheFactory.getCache("dist-cache");
  2. cache.put(key, value);
  3. Object value = cache.get(key);

正是基于以上技术和特点,Coherence成为一个高可用性,高扩展性,高性能但使用非常简单的网格型(Data Grid)分布式缓存框架。

Coherence企业级缓存(二) QuickStart和编程

2. Quick start 
2.1 安装 
Coherence是纯Java的框架,不需要额外的安装。首先在Oracle网站上下载开发包,最新为3.4版,只有13M,可以说是很小很强大。 
SDK解压即可,包含 bin, doc, example, lib 四个目录。Doc下包含了完整的user-guide,只是有点长,有350多页。

2.2 运行 
Coherence集群是由Node构成的,每个Node既存储数据,又可以查询数据。 
运行 bin/coherence.cmd 命令就能启动一个Node实例。 
运行多次,就能启动多个实例,各Node能自动检测到网路内新启动的Node,并加入集群。 
第一个节点启动信息大致为:

引用

MasterMemberSet 
  ( 
  ThisMember=Member(Id=1, Timestamp=2007-05-23 10:48:17.0, Address=192.168.0.204:8088, MachineId=26828) 
  OldestMember=Member(Id=1, Timestamp=2007-05-23 10:48:17.0, Address=192.168.0.204:8088, MachineId=26828) 
  ActualMemberSet=MemberSet(Size=1, BitSetCount=2 
    Member(Id=1, Timestamp=2007-05-23 10:48:17.0, Address=192.168.0.204:8088, MachineId=26828) 
    )

第二个节点启动信息大致为:

引用

MasterMemberSet 
  ( 
  ThisMember=Member(Id=2, Timestamp=2007-05-23 10:48:53.218, Address=192.168.0.204:8089, MachineId=26828) 
  OldestMember=Member(Id=1, Timestamp=2007-05-23 10:48:17.0, Address=192.168.0.204:8088, MachineId=26828) 
  ActualMemberSet=MemberSet(Size=2, BitSetCount=2 
    Member(Id=1, Timestamp=2007-05-23 10:48:17.0, Address=192.168.0.204:8088, MachineId=26828) 
    Member(Id=2, Timestamp=2007-05-23 10:48:53.218, Address=192.168.0.204:8089, MachineId=26828) 
    )

最后会出现命令行提示符,通过Coherence控制台命令就可以执行Cache的基本操作。

引用

Map (?):

最常用命令有: 
创建或切换到一个cache:

引用

Map (?): cache ccc1

Put一个数据:

引用

Map (ccc1): put key1 value1

Get一个数据:

引用

Map (ccc1): get key1

查看有哪些cache:

引用

Map (?): maps

查看一个cache下的所有key:

引用

Map (ccc1): list

你不必关心数据存在哪里,可以在Node1上 put一个数据,在Node2上get出来。 
默认启动Node使用的是 Coherence.jar中的缓存配置文件 coherence-cache-config.xml ,使用的是DistributedCache 分区缓存。

3. 编程 
正如第一节所说,使用Coherence进行数据管理的应用程序中的API调用非常简单,无论集群有多少个物理机器,多少个节点实例,客户端只逻辑上面对集群。

Java代码  

  1. NamedCache cache = CacheFactory.getCache( cacheName );
  2. cache.put(key, value);
  3. Object value = cache.get(key);

记得在你的应用中(例如:BOSS,CRM等)中包含 coherence.jar, tangosol.jar 等必要的类库文件。 
Coherence企业级缓存(三) 四种缓存类型

4. 基本缓存类型及适用情况 
Coherence 支持四种Cache类型(Cache Type),也可看作四种缓存系统架构: 
4.1 复制缓存(Replicated Cache) 
数据在集群成员中进行全复制,每个节点都有一个完整的数据拷贝。这种集群下,read性能最高( cache.get(key) 操作),容错性好,但cache.put(key,value) 操作性能较低。如果Node很多,每次put操作都要在所有成员上执行一次。 
  cache.get(key) 

cache.put(key,value)

这是一种传统的集群技术,不是Coherence的亮点。

4.1 乐观缓存 (Optimistic Cache) 
它类似于复制缓存,但不提供并发控制(Concurrency Control)。这种集群数据吞吐量最高,各节点容易出现数据不一致的情况。

4.1 分区缓存 (Distributed (Partitioned) Cache) 
Coherence 的亮点。默认情况下,一份数据A只在两个节点上有拷贝,第二份作为备份数据(Backup),用于容错。
从整体上看,假设应用需要的Cache总内存为 M,该模式将数据分散到N个节点上,每个JVM只占用 M/N  的内存消耗,与复制缓存每节点消耗 M量的内存形成对比,它可以极大节省内存资源。 
    cache.get(key) 

cache.put(key,value) 

4.1 Near缓存 (NearCache) 
分区缓存的改进版。分区缓存将数据全部存到Cache Node上,而Near缓存将缓存数据中使用频率最高的数据(热点数据Hotspot)放到应用的本地缓存(Local Cache)区域。由于本地内存访问的高效性,它可以有效提升分区缓存的read性能。

四种缓存类型的基本特点对比如下表所示: 
几个重要因素: 
JVM数量(N): 即启动的Node数量,每个节点为一个JVM进程; 
数据大小(M):要缓存的数据总量的占用空间大小,如10M,120M等; 
冗余度(R) :缓存的secondary备份个数。分区缓存默认为1,可以配置2,3,… 
本地缓存大小(L):(仅对Near缓存而言)应用所在的本地缓存的空间大小字节数。

几种类型的对比 
 
Coherence企业级缓存(四) 数据管理模式

Coherence提供了四种Cache数据管理模式: 
Read-Through, 
Write-Through, 
Refresh-Ahead 
Write-Behind

数据管理模式体现在CacheStore 接口的功能上。 
CacheStore负责直接和数据源交互,进行增删改查操作;并也负责和Coherence Cache交互,向其中写数据(put),读数据(get)和删除数据(remove)。CacheStore相当于 数据源和Cache间的桥梁。

对于不同的应用,由于数据源不同,如:DB,WebService ,FileSystem等, CacheStore有不同的实现。它一般作为应用的一部分。Coherence也为 Hibernate,Toplink等实现了一个CacheStore。

 
5.1 Read-Through 
Read-Through 的基本特点是同步读取。步骤为: 
1)应用调用 CacheStore 查询数据X; 
2)CacheStore 去Cache中查询,未发现数据时,向数据库执行查询操作,并将查询结果放到 Cache中, 并将结果返回给应用; 
3)如果发现Cache中有数据,则直接从Cache读取,并返回给应用。 
其特点体现在第二步,CacheStore调用 cache.get(X) 到 CacheStore 给应用返回数据,是同步操作。 也就是要在一个同步过程中先等待数据查询,Cache被填充,才能获得数据。 这种模式的性能比较低,不及 Refresh-Ahead。

5.2 Write-Through 
Write-Through 对应于数据修改操作,如 update,也具有同步的特点。 
1)应用调用 CacheStore update数据X; 
2)CacheStore 先update Cache中的数据,然后再向数据库执行update操作; 
这种模式在一个同步过程中,先改Cache,再改数据库。因此性能也不是最理想的。

5.2 Refresh-Ahead 
与Read-Through相对,它是异步的。 
Coherence在Cache数据过期前,有CacheStore自动重新从数据库加载数据。而前台应用在查询数据时,CacheStore 仅调用Cache.get(X)。因此这种模式的效率明显高于read-through。 自动重载数据的时间可以设定。

5.2 Write-behind 
与write-through相对,它是异步的。 
应用调用CacheStore进行update时,CacheStore不去操作数据库,直接返回结果。而Coherence集群自动对操作进行排队(queue),在间隔一段时间后(interval), CacheStore在执行队列中的 update 操作。 这样,减少的同步操作数据库的时间被节省,修改类功能的性能就能得到大幅提高。这也是Coherence的一大特色。 
Coherence企业级缓存(五)与Hibernate集成(1)

3. Cache客户端配置:Hibernate配置 
3.1) hibernate.cfg.xml

Xml代码  

  1. <property name="hibernate.cache.provider_class">
  2. com.tangosol.coherence.hibernate.CoherenceCacheProvider</property>
  3. <property name="hibernate.cache.use_minimal_puts">true</property>
  4. <property name="hibernate.cache.use_query_cache">true</property>

3.2) 启用查询缓存的代码 
要确保代码中使用查询,即在创建 query 后,打开开关,并设置cacheRegion,本例中使用统一的 cacheRegion “HIBERNATE_QUERY_CACHE”

Java代码  

  1. query.setCacheable(true);
  2. query.setCacheRegion(HIBERNATE_QUERY_CACHE);

3.3) 启用实体L2缓存 
在 hbm.xml 中配置  节点,为VO类启用实体缓存。

Xml代码  

  1. <class name="com.xxx.system.perm.persistent.PermVO" table="SYS_PERM">
  2. <cache usage="nonstrict-read-write"/>

3.4) 客户端缓存配置 
客户端要使用与服务端同样的缓存配置 hibernate-cache-config.xml, 否则可能无法进行存储。 本例将其复制过来,放到classpath 下的 config目录中,因此,客户端启动命令(如果是tomcat,weblogic,websphere,修改相应cmd或bat文件)中也要加java参数:

引用

-Dtangosol.coherence.cacheconfig=config/hibernate-cache-config.xml

4. 启动客户端Hibernate应用程序

执行数据查询操作,观察日志,以确定数据存储到了M2的三个节点中。 
4.1) Coherence客户端启动日志

引用

2008-10-14 17:56:13.609 Oracle Coherence 3.3.1/389  (thread=main, member=n/a): Loaded ... 
2008-10-14 17:56:13.625 Oracle Coherence 3.3.1/389  (thread=main, member=n/a): Loaded ... 
2008-10-14 17:56:13.625 Oracle Coherence 3.3.1/389  (thread=main, member=n/a): Optional ...

Oracle Coherence Version 3.3.1/389 
Grid Edition: Development mode 
Copyright (c) 2000-2007 Oracle. All rights reserved. 
2008-10-14 17:56:15.296 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): Service Cluster ... 
2008-10-14 17:56:15.515 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): This Member(Id=5,... 
2008-10-14 17:56:15.609 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): Member(Id=2, Ti... 
2008-10-14 17:56:15.609 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): Member(Id=3, .... 
2008-10-14 17:56:15.703 Oracle Coherence GE 3.3.1/389  (thread=main, member=5):

4.2) 观察Hibernate SQL输出 
记得在log4j.xml 中打开相应的日志开关:

Xml代码  

  1. <category name="org.hibernate.SQL">
  2. <priority value="DEBUG" />
  3. <appender-ref ref="CONSOLE" /> <!-- ASYNC_Hibernate_SQL -->
  4. </category>

观察日志输出

引用

Execute No. 1 ******************** 
2008-10-14 18:00:44,687 [DEBUG](AbstractBatcher.java,346) - select  this.PERMCODE as  PERM1_15_0_, .... 
(No.1)result size:1

Execute No. 2 ******************** 
(No.2)result size:1

Execute No. 3 ******************** 
(No.3)result size:1

Execute No. 4 ******************** 
(No.4)result size:1

Execute No. 5 ******************** 
(No.5)result size:1

第一次执行了sql, 
后面sql都未执行,并且查询结果数为1,和第一次执行sql的结果相同。表明之后从Coherence中获取了数据, 缓存生效。

4.3) 查看M2 上的cache数据:

在M2上的节点控制台切换到 HIBERNATE_QUERY_CACHE cache下面,执行:

引用

cache HIBERNATE_QUERY_CACHE

并执行Coherence命令

引用

list

命令查看所有已在Cache中存储的数据。 下面的日志每个 sql:开头的就是一个对Query的缓存项。

引用

Map (HIBERNATE_QUERY_CACHE): list 
sql: select managelogv0_.LOGID as LOGID5_, managelogv0_.OPRTIME as 
TE5_, managelogv0_.OPRACTION as OPRACTION5_, managelogv0_.OPRTYPE a 
OG managelogv0_; parameters: ; named parameters: {}; first row: 0; 
, 285, 286, 287, 288, 321] 
key1 = value1 
sql: select  this.PERMCODE as  PERM1_15_0_,  this.MODULECODE as  MO 
RM5_15_0_,  this.PORTNO as  PORT6_15_0_ from (select  t.perm_code a 
       t.module_code as moduleCode, 
       t.perm_name as permName, 
       t.perm_desc as permDesc, 
       t.port_no as portNo, 
       t.perm_type_code as permTypeCode 
                from sys_perm t join sys_role_perm o 
    on t.perm_code = o.perm_code 
    where o.role_code = ? ) this  ; parameters: ; named parameters: 
sql: select count(*) as col_0_0_ from SYS_MANAGELOG managelogv0_; p&hellip;.

OK, 大功告成,成功将Coherence与Hibernate集成,Hibernate通过Coherence进行实体数据,查询数据的缓存。
Coherence企业级缓存(五)与Hibernate集成(2)

3. Cache客户端配置:Hibernate配置 
3.1) hibernate.cfg.xml

Xml代码  

  1. <property name="hibernate.cache.provider_class">
  2. com.tangosol.coherence.hibernate.CoherenceCacheProvider</property>
  3. <property name="hibernate.cache.use_minimal_puts">true</property>
  4. <property name="hibernate.cache.use_query_cache">true</property>

3.2) 启用查询缓存的代码 
要确保代码中使用查询,即在创建 query 后,打开开关,并设置cacheRegion,本例中使用统一的 cacheRegion “HIBERNATE_QUERY_CACHE”

Java代码  

  1. query.setCacheable(true);
  2. query.setCacheRegion(HIBERNATE_QUERY_CACHE);

3.3) 启用实体L2缓存 
在 hbm.xml 中配置  节点,为VO类启用实体缓存。

Xml代码  

  1. <class name="com.xxx.system.perm.persistent.PermVO" table="SYS_PERM">
  2. <cache usage="nonstrict-read-write"/>

3.4) 客户端缓存配置 
客户端要使用与服务端同样的缓存配置 hibernate-cache-config.xml, 否则可能无法进行存储。 本例将其复制过来,放到classpath 下的 config目录中,因此,客户端启动命令(如果是tomcat,weblogic,websphere,修改相应cmd或bat文件)中也要加java参数:

引用

-Dtangosol.coherence.cacheconfig=config/hibernate-cache-config.xml

4. 启动客户端Hibernate应用程序

执行数据查询操作,观察日志,以确定数据存储到了M2的三个节点中。 
4.1) Coherence客户端启动日志

引用

2008-10-14 17:56:13.609 Oracle Coherence 3.3.1/389  (thread=main, member=n/a): Loaded ... 
2008-10-14 17:56:13.625 Oracle Coherence 3.3.1/389  (thread=main, member=n/a): Loaded ... 
2008-10-14 17:56:13.625 Oracle Coherence 3.3.1/389  (thread=main, member=n/a): Optional ...

Oracle Coherence Version 3.3.1/389 
Grid Edition: Development mode 
Copyright (c) 2000-2007 Oracle. All rights reserved. 
2008-10-14 17:56:15.296 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): Service Cluster ... 
2008-10-14 17:56:15.515 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): This Member(Id=5,... 
2008-10-14 17:56:15.609 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): Member(Id=2, Ti... 
2008-10-14 17:56:15.609 Oracle Coherence GE 3.3.1/389  (thread=Cluster, member=n/a): Member(Id=3, .... 
2008-10-14 17:56:15.703 Oracle Coherence GE 3.3.1/389  (thread=main, member=5):

4.2) 观察Hibernate SQL输出 
记得在log4j.xml 中打开相应的日志开关:

Xml代码  

  1. <category name="org.hibernate.SQL">
  2. <priority value="DEBUG" />
  3. <appender-ref ref="CONSOLE" /> <!-- ASYNC_Hibernate_SQL -->
  4. </category>

观察日志输出

引用

Execute No. 1 ******************** 
2008-10-14 18:00:44,687 [DEBUG](AbstractBatcher.java,346) - select  this.PERMCODE as  PERM1_15_0_, .... 
(No.1)result size:1

Execute No. 2 ******************** 
(No.2)result size:1

Execute No. 3 ******************** 
(No.3)result size:1

Execute No. 4 ******************** 
(No.4)result size:1

Execute No. 5 ******************** 
(No.5)result size:1

第一次执行了sql, 
后面sql都未执行,并且查询结果数为1,和第一次执行sql的结果相同。表明之后从Coherence中获取了数据, 缓存生效。

4.3) 查看M2 上的cache数据:

在M2上的节点控制台切换到 HIBERNATE_QUERY_CACHE cache下面,执行:

引用

cache HIBERNATE_QUERY_CACHE

并执行Coherence命令

引用

list

命令查看所有已在Cache中存储的数据。 下面的日志每个 sql:开头的就是一个对Query的缓存项。

引用

Map (HIBERNATE_QUERY_CACHE): list 
sql: select managelogv0_.LOGID as LOGID5_, managelogv0_.OPRTIME as 
TE5_, managelogv0_.OPRACTION as OPRACTION5_, managelogv0_.OPRTYPE a 
OG managelogv0_; parameters: ; named parameters: {}; first row: 0; 
, 285, 286, 287, 288, 321] 
key1 = value1 
sql: select  this.PERMCODE as  PERM1_15_0_,  this.MODULECODE as  MO 
RM5_15_0_,  this.PORTNO as  PORT6_15_0_ from (select  t.perm_code a 
       t.module_code as moduleCode, 
       t.perm_name as permName, 
       t.perm_desc as permDesc, 
       t.port_no as portNo, 
       t.perm_type_code as permTypeCode 
                from sys_perm t join sys_role_perm o 
    on t.perm_code = o.perm_code 
    where o.role_code = ? ) this  ; parameters: ; named parameters: 
sql: select count(*) as col_0_0_ from SYS_MANAGELOG managelogv0_; p&hellip;.

OK, 大功告成,成功将Coherence与Hibernate集成,Hibernate通过Coherence进行实体数据,查询数据的缓存。
Coherence企业级缓存(六) JMX 管理和监控

7.1 概述 
Coherence支持集群JMX管理和监控,方便在多Node环境下的统一管理。 
根据Coherence官方的推荐,一般一个集群中只设置一个JMX管理服务器(MBeanServer),并且管理服务器不存储数据(设置启动参数storage_enabled=false);其他Node为受管节点,存储数据。

7.2 启动参数 
要为节点启用JMX管理,启动时只要加入必要的java property即可。一般可以JDK5+自带的JConsole工具做管理和监控。 
JMX Server:

引用

-Dtangosol.coherence.management=all -Dtangosol.coherence.management.remote=true -Dcom.sun.management.jmxremote

JMX Node:

引用

-Dtangosol.coherence.management.remote=true -Dcom.sun.management.jmxremote

7.3 JMX Server监控 
通过JConsole连接Coherence JMX Server后的界面如下图所示:

 
图中, 
Cluster代表整个集群 
Node节点下代表各节点,图中有1,2 两个节点; 
Cache目录代表当前集群中创建的的NamedCache,图中展示了集群中有一个分区缓存 cache1,存储在节点2 中。 
其他还有Server,StorageManager,PointToPoint等管理项。

右侧列出了所选项目的详细属性,图中为Node 2 上数据存储的信息,比较有用的是 
命中次数CacheHits, 
失误次数CacheMisses, 
缓存访问次数:TotalGets,通过 CacheHits/ TotalGets 就可得到命中率 
缓存元素上限:HighUnits等。

通过观察各节点Cache的主要指标,就可以监控Coherence的运行情况,分析缓存的利用效率。见下图例: 

图显示了在JOP号码资源应用下,号码资源VO的CacheHits变化情况,命中数在逐步提高,为2800,说明缓存有效发挥了其作用;当然命中率是反映Cache利用率更为直观的指标。

7.4 Node监控 
通过连接不同Node,还可以监控各存储节点的内存变化等信息,为调优提供必要依据。 
  

Coherence企业级缓存(七) 性能调优

Coherence调优是很关键的一环,特别是对大型企业级应用,海量数据型应用,它将决定Coherence集群能否将效能最大化的发挥出来。

调优通常分三步:基础调优,运行前常规调优,运行后调优

8.1基础调优 
包括操作系统调优,网络调优 
操作系统的一些参数,对Coherence集群的数据传输有影响。 
如:非Wins系统下Socket缓冲大小,应该至少增加到2M;Windows上的Datagram大小等,这些在官方指南中有详细的说明。

网络调优主要对交换机缓冲(Switch Buffer), Path MTU 等因素,比较常见的情况是,交换机缓存如果太小,Coherence在做Node通信时会发生延迟,Node日志一般为:

引用

Experienced a 4172 ms communication delay (probable remote GC) with Member(Id=7, Timestamp=2006-10-20 12:15:47.511, Address=192.168.0.10:8089, MachineId=13838); 320 packets rescheduled, PauseRate=0.31, Threshold=512

此时就需要增加交换机缓冲大小。

8.2运行前常规调优 
指根据Coherence一般经验原则和最佳实践,在应用系统运行前分析缓存数据总量大小,计算Node个数,设置Node JVM内存等。 
缓存数据总量大小(DataSize, M):根据应用规模,数据量规模,业务频度,预先估计应该纳入缓存的数据量的大小(总字节数)。对大型系统来说,可能是1G – xG。 
计算节点个数:分区和Near缓存每节点只承担 M/N 的数据量,Coherence的原则是,尽量多节点,而不要将Node的内存设置过大,避免GC时间过长,一般不要超过 1G;因此,得到估计的数据总量大小M后,就可以估计需要配置的节点数,假设JVM mx为512M,则N=M/512,并据此推测需要的物理机器的数量。 
JVM内存:Coherence默认为64M,每节点最大不要超过1G。并且最小和最大值设置为相同。当然可以根据项目情况,设置为 384m, 128m等。 
例如:

引用

java -server -Xms1024m -Xmx1024m

GC 参数:一般应用Coherence的多为大型系统,多CPU;且缓存数据变化可能比较频繁。

引用

因此生产环境最好采用 并发的GC策略, 
GC收集器个数设置为 CPU个数; 
适当加大新生代的内存大小。

8.3运行后调优 
系统上线后,在运行过程中,可能会出现性能不如预期的情况,或者不定期出现缓慢情况。除了对JVM 垃圾回收问题进行分析,还可以对应用进行分析,对缓存配置进行优化。 
JVM 垃圾回收问题:节点GC时,会导致Node间的传输暂停,需要重传,引起集群性能下降。可可以通过Node的日志观察到,类似于:

引用

Experienced a 4172 ms communication delay (probable remote GC)

除了之前的优化交换机缓冲,还要考虑垃圾回收引起此问题的具体原因,可以通过打开垃圾回收日志进行观察,这通常可能会定位到程序代码的算法等问题。

引用

"-verbose:gc" or "-Xloggc:"

应用分析: 
如果为了简便,在Coherence配置中使用 * 配置NamedCache的存储属性,那么意味着,所有NamedCache或者说一部分Cache 使用了相同的设置,如元素个数,超时时间,清除策略,前端缓存大小等。

Xml代码  

  1. <cache-mapping>
  2. <!—Hiberante Entity cache configuration -->
  3. <cache-name>*</cache-name> <!— 类似配置如:near-*, com.xxx.crm.customer.* ?-->
  4. <scheme-name>hibernate-near</scheme-name>
  5. <init-params>
  6. <init-param> <!-- 后端entry个数限制 -->
  7. <param-name>back-size-limit</param-name>   <param-value>1000</param-value>
  8. </init-param>
  9. <init-param> <!-- 后端超时时间 30m -->
  10. <param-name>back-expiry</param-name>   <param-value>30m</param-value>
  11. </init-param>
  12. </init-params>
  13. </cache-mapping>

但不同业务功能其数据量大小,查询频率,查询条件的多样性,数据修改的频率都是不同的,如果配置相同,则Cache机制在不同业务上体现的性能是不同的,应该区别对待,例如: 
1) 数据字典修改频率极低,可以只采用local cache, 超时时间设置长一些,例如12h 。 
2) 鉴权操作频率很高,因此要求高性能。鉴权数据中权限点修改频率低,但角色授权数据修改频率略高,但比一般业务也低很多,可以将 front cache设置大一些,或者只采用local访问。 
3) 在Hibernate中,低频修改数据缓存配置为 nonstrict-read-write 类型;只读数据采用 read-only 型。 
4) 至于业务数据,情况比较复杂。 
例如:手机号码表,数据量极大,并且服务于BOSS大部分业务,并且手机号码的用户资料变更较少,因此缓存可以设置大些, 超时时间设置长些。而类似的渠道数据,数据量略小一些,HighUnits可设置稍小一些。 
而对于一些修改频繁,或新增频繁的数据,超时时间(Expiry Delay) 应当设置小一些。

此类分析应该跟踪生产环境的运行情况,业务频率,修改操作频率等,进行调整优化,并跟踪调优后的结果。

9. 结束 
Oracle Coherence具有一般缓存框架的极不一样的强大特性,自管理,分区缓存,线性扩展等使得它能有效提升应用,特别是大型企业级应用的性能。Coherence也是一个网格计算方案,其线性扩展也体现了“另类”的系统架构,能发挥出强大的功能。

参考资料: 
1. Oracle. Coherence User-guide.htm 
2. http://www.oracle.com/technology/global/cn/products/coherence/index.html 
3. iniu blog   http://iniu.net/iwork/2008/02/oracle-coherence.html

Coherence企业级缓存(一) 特点 
Coherence企业级缓存(二) QuickStart和编程 
Coherence企业级缓存(三) 四种缓存类型 
Coherence企业级缓存(四) 数据管理模式
Coherence企业级缓存(五)与Hibernate集成(1) 
Coherence企业级缓存(五)与Hibernate集成(2)
Coherence企业级缓存(六) JMX 管理和监控 
Coherence企业级缓存(七) 性能调优

转载自:http://raymondhekk.iteye.com/blog/256831

时间: 2024-08-05 00:21:39

分布式网格缓存Coherence简介的相关文章

memached分布式内存缓存服务器

一:memached简介 在许多高并发的应用中,把业务数据保持久化 ( 保存到数据库,磁盘文件或其它 ) 后,应用从持久化设备中读取数据并在浏览器中显示,随用户量,数据量增大,访问的集中,会出现持久化设备负担过重(典型的就是数据库),影响应用响应速度,应用延迟严重等重大问题.典型的应用就是 WEB 应用中的高并发网站. 这时候应用就需要一种缓存机制来提高并发读取速度的性能 , memcached 能在大中型系统中提供优秀的缓存服务. memcached 是高性能的分布式内存缓存服务器.一般的使用

分布式消息系统 Kafka 简介

Kafka是分布式发布-订阅消息系统.它最初由LinkedIn公司开发,之后成为Apache项目的一部分.Kafka是一个分布式的,可划分的,冗余备份的持久性的日志服务.它主要用于处理活跃的流式数据. 在大数据系统中,常常会碰到一个问题,整个大数据是由各个子系统组成,数据需要在各个子系统中高性能,低延迟的不停流转.传统的企业消息系统并不是非常适合大规模的数据处理.为了已在同时搞定在线应用(消息)和离线应用(数据文件,日志)Kafka就出现了.Kafka可以起到两个作用: 降低系统组网复杂度. 降

CYQ.Data V5 分布式自动化缓存设计介绍(二)

前言: 最近一段时间,开始了<IT连>创业,所以精力和写的文章多数是在分享创业的过程. 而关于本人三大框架CYQ.Data.Aries.Taurus.MVC的相关文章,基本都很少写了. 但框架的维护升级,还是时不时的在进行中的,这点从开源的Github上的代码提交时间上就可以看出来了. 毕竟<IT连>的后台WebAPI,用的是Taurus.MVC,后台系统管理用的是Aries. 不过今天,就不写创业相关的文章了,先分享篇技术类的文章. CYQ.Data 分布式自动缓存 之前写过一篇

Lind.DDD.Caching分布式数据集缓存介绍

戏说当年 大叔原创的分布式数据集缓存在之前的企业级框架里介绍过,大家可以关注<我心中的核心组件(可插拔的AOP)~第二回 缓存拦截器>,而今天主要对Lind.DDD.Caching进行更全面的解决,设计思想和主要核心内容进行讲解.其实在很多缓存架构在业界有很多,向.net运行时里也有Cache,也可以实现简单的数据缓存的功能,向前几年页面的静态化比较流行,就出现了很多Http的"拦截器",对当前HTTP响应的内容进行完整的页面缓存,缓存的文件大多数存储到磁盘里,访问的时间直

分布式数据库缓存系统Apache Ignite

Apache Ignite内存数据组织是高性能的.集成化的以及分布式的内存平台,他可以实时地在大数据集中执行事务和计算,和传统的基于磁盘或者闪存的技术相比,性能有数量级的提升. 将数据存储在缓存中能够显著地提高应用的速度,因为缓存能够降低数据在应用和数据库中的传输频率.Apache Ignite允许用户将常用的热数据储存在内存中,它支持分片和复制两种方式,让开发者可以均匀地将数据分布式到整个集群的主机上.同时,Ignite还支撑任何底层存储平台,不管是RDBMS.NoSQL,又或是HDFS. 在

Memcached:高性能的分布式内存缓存服务器

特征: u 协议简单: n 基于文本行的协议 u 基于libevent的事件处理: n 程序库,能实现连接数的增加,O(1)性能 u 内置内存存储方式 n 数据存储在内存,重启数据消失,在数据达到某个值时,基于LRU(Last Recently Used)算法删除不使用的缓存 u Memcached互不通信的分布式 n 服务器端没有分布式功能,实现分布式取决于客户端 n  Memcached的使用: u 保存的方法: n add:仅当存储空间不存在相同的数据才保存 n replace:仅当存储空

Varnish缓存代理简介与配置

一.varnish原理: 1)Varnish简介: varnish缓存是web应用加速器,同时也作为http反向缓存代理.你可以安装varnish在任何http的前端,同时配置它缓存内容.与传统的 squid 相比,varnish 具有性能更高.速度更快.管理更加方便等诸多优点.有一部分企业已经在生产环境中使用其作为旧版本的squid的替代方案,以在相同的服务器成本下提供更好的缓存效果,Varnish更是作为CDN缓存服务器的可选服务之一. 根据官网的介绍,Varnish的主要特性如下:http

分布式监控系统Ganglia简介及安装

一.Ganglia简介 Ganglia是一款为HPC(高性能计算) 集群设计的可扩展性 的分布式监控系统,它可以监视和显示集群中节点的各种状态信息,他由运行在各个节点上的gmond守护进程来采集 CPU.内存.磁盘利用率.I/O负载.网络流量情况等方面的数据.然后汇总到gmetad守护进程下,使用rrdtool存储数据,然后将历史数据以曲线方式通过PHP页面呈现. Ganglia监控系统由三部分组成,分别是gmond.gmetad.webfrontend gmond  一个守护进程运行在每个需要

[转]缓存、缓存算法和缓存框架简介

以下内容转自:http://www.leexiang.com/cache-algorithm (转载请注明出处)-----------------------------------分割线---------------------------------------------- 引言 我们都听过 cache,当你问他们是什么是缓存的时候,他们会给你一个完美的答案,可是他们不知道缓存是怎么构建的,或者没有告诉你应该采用什么标准去选择缓存框架.在这边文章,我们会去讨论缓存,缓存算法,缓存框架以及哪