1,ORACLE Dataguard角色切换
DataGuard已经是现今标准的主流容灾方案,由于日志传递对于网络适应程度强,且可以采用同步实时的传递方式和异步延迟的传递方式,甚至可以成为远程的异地容灾方案。不管用于何种用途,DG都免不了要进行角色转换,即将standby 数据库切换为primary数据库,角色转换分为:switchover和failover两种
2,两种方式的异同
1),switchover是primary库转换成standby库、standby库转换成primary库
2),failover后standby转换成primary库启用
3)、使用场合不同:Switchover 用于有准备的、计划之中的切换,通常是系统升级、数据迁移等常态任务;Failover用于意料之外的突发情况,比如异常掉电、自然灾难等等。
4)、数据丢失程度不同:Switchover不会丢失数据,Failover通常意味着有部分数据丢失。
5)、善后处理的不同:Switchover之后Dataguard环境不会被破坏,任然有Primary、Standby两种角色的系统存在。但是Failover之后,Dataguard环境就会被破坏,必须需要重建。
3.在primary上做switchover操作
switchover 准备工作,注意,如果要转换角色的standby 处于maximum protection 模式,需要你首先将其切换为maximum performance 模式,
先检查是否支持switch操作,登录primary库,去查询v$database表的switchover_status列
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
--------------------
TO STANDBY
SQL>
如果该列值为"TO STANDBY"则表示primary 数据库支持转换为standby 角色,否则的话你就需要重新检查一下Data Guard 配置,比如看看LOG_ARCHIVE_DEST_n 之类参数值是否正确有效等等。
3.1,启动switchover --primary上操作
首先将primary 转换为standby 的角色,通过下列语句:
alter database commit to switchover to physical standby;
SQL> alter database commit to switchover to physical standby;
Database altered.
SQL>
3.2 重启到mount
SQL> shutdown immediate
ORA-01507: database not mounted
ORACLE instance shut down.
SQL> startup mount
ORACLE instance started.
Total System Global Area 3373858816 bytes
Fixed Size 2218032 bytes
Variable Size 1845495760 bytes
Database Buffers 1509949440 bytes
Redo Buffers 16195584 bytes
Database mounted.
SQL>
3.3,去查看当前的状态
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
--------------------
TO PRIMARY
SQL>
switchover_status为TO PRIMARY。
SQL> select open_mode,database_role from v$database;
OPEN_MODE DATABASE_ROLE
-------------------- ----------------
MOUNTED PHYSICAL STANDBY
SQL>
database_role为物理standby(PHYSICAL STANDBY)。
转换成功。
4 在待转换的standby库上做switchover操作
4.1 查看下,是否支持switchover切换操作
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
--------------------
TO PRIMARY
SQL>
此时待转换standby 数据库switchover_status 列值应该是"TO_PRIMARY",如否则检查其初始化参数文件中的设置,提示一下,比着原primary 数据库的初始化参数改改。
4.2,转换成primary,通过下列语句转换standby 到primary 角色:
alter database commit to switchover to primary;
SQL> alter database commit to switchover to primary;
Database altered.
SQL>
注意:待转换的物理standby 可以处于mount 模式或open read only 模式,但不能处于open read write模式。
4.3,完成转换,打开新的primary 数据库
alter database open;
注:如果数据库处于open read-only 模式的话,需要先shutdown 然后直接startup 即可。
查看数据库模式:
SELECT open_mode,database_role FROM v$database;
SQL> SELECT open_mode,database_role FROM v$database;
OPEN_MODE DATABASE_ROLE
-------------------- ----------------
READ WRITE PRIMARY
SQL>
5,验证一下新的primary以及新的standby操作
去新的primary上
SQL> show parameter db_unique
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
db_unique_name string pdunq_dg
SQL>
SQL>
SQL> select max(sequence#) from v$archived_log;
MAX(SEQUENCE#)
--------------
369
SQL>
SQL> alter system switch logfile;
System altered.
SQL>
select max(sequence#) from v$archived_log;
SQL> select max(sequence#) from v$archived_log;
MAX(SEQUENCE#)
--------------
370
SQL>
去新的standby库查看下
SQL> select max(sequence#) from v$archived_log;
MAX(SEQUENCE#)
--------------
368
SQL>
redo日志没有传送到新的standby上面去,检查下新primary的alert日志,如下报错:
Mon Feb 09 16:55:35 2015
Error 12154 received logging on to the standby
Errors in file /oracle/app/oracle/diag/rdbms/pdunq_dg/powerdes/trace/powerdes_arc2_23808.trc:
ORA-12154: TNS:could not resolve the connect identifier specified
PING[ARC2]: Heartbeat failed to connect to standby ‘pdunq_dg‘. Error is 12154.
Mon Feb 09 16:56:35 2015
Error 12154 received logging on to the standby
Errors in file /oracle/app/oracle/diag/rdbms/pdunq_dg/powerdes/trace/powerdes_arc2_23808.trc:
ORA-12154: TNS:could not resolve the connect identifier specified
PING[ARC2]: Heartbeat failed to connect to standby ‘pdunq_dg‘. Error is 12154.
6,问题排查
这个报错原因是因为原来的primary和standby的db_unique_name不一样,所以switchover后,原来指向的归档参数的db_unique_name要与新的standby保持一致,也就是要保持成pdunq才行:
去查看下 show parameter log_archive_dest_2参数:
SQL> show parameter log_archive_dest_2;
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
log_archive_dest_2 string SERVICE=pdunq_dg lgwr sync af
firm VALID_FOR=(ONLINE_LOGFILE
S,PRIMARY_ROLE) DB_UNIQUE_NAME
=pdunq
log_archive_dest_20 string
log_archive_dest_21 string
log_archive_dest_22 string
log_archive_dest_23 string
log_archive_dest_24 string
log_archive_dest_25 string
log_archive_dest_26 string
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
log_archive_dest_27 string
log_archive_dest_28 string
log_archive_dest_29 string
SQL>
--修改log_archive_dest_2参数
alter system set log_archive_dest_2=‘SERVICE=pdunq_dg lgwr sync affirm VALID_FOR=(ONLINE_LOGFILES,PRIMARY_ROLE) DB_UNIQUE_NAME=pdunq‘;
alter system set log_archive_dest_state_2=enable;
alter system switch logfile;
SQL> alter system set log_archive_dest_2=‘SERVICE=pdunq_dg lgwr sync affirm VALID_FOR=(ONLINE_LOGFILES,PRIMARY_ROLE) DB_UNIQUE_NAME=pdunq‘;
System altered.
SQL> alter system set log_archive_dest_state_2=enable;
System altered.
SQL> alter system switch logfile;
System altered.
SQL>
去新的primary、standby库使用select max(sequence#) from v$archived_log;检查记录
SQL> select max(sequence#) from v$archived_log;
MAX(SEQUENCE#)
--------------
373
SQL>
至此,switchover成功结束。
7, failover 物理standby的转换成primary库
7.1、检查归档文件是否连续 在standby上操作
查询待转换standby 数据库的V$ARCHIVE_GAP 视图,确认归档文件是否连接:
SQL> SELECT THREAD#, LOW_SEQUENCE#, HIGH_SEQUENCE# FROM V$ARCHIVE_GAP;
no rows selected
SQL>
如果返回的有记录,按照列出的记录号复制对应的归档文件到待转换的standby 服务器。这一步非常重
要,必须确保所有已生成的归档文件均已存在于standby 服务器,不然可能会数据不一致造成转换时报错。
文件复制之后,通过下列命令将其加入数据字典:
ALTER DATABASE REGISTER PHYSICAL LOGFILE ‘filespec1‘;
7.2、检查归档文件是否完整
分别在primary/standby 执行下列语句:
SQL> select distinct thread#,max(sequence#) over(partition by thread#) a from v$archived_log;
THREAD# A
---------- ----------
1 375
SQL>
该语句取得当前数据库各线程已归档文件最大序号,如果primary 与standby 最大序号不相同,必须将
多出的序号对应的归档文件复制到待转换的standby 服务器。不过既然是failover,有可能primary 数据库此
时已经无法打开,甚至无法访问,那你只好听天由命喽。
7.3、启动failover 在standby上执行
执行下列语句:alter database recover managed standby database finish force;
SQL> alter database recover managed standby database finish force;
Database altered.
SQL>
FORCE 关键字将会停止当前活动的RFS 进程,以便立刻执行failover。
剩下的步骤就与一般的switchover 很相似了
7.4、切换物理standby 角色为primary
SQL> SQL> alter database commit to switchover to primary;
Database altered.
SQL>
7.5、启动新的primary 数据库。
如果当前数据库已mount,直接open 即可,如果处于read-only 模式,需要首先shutdown immediate,然后再直接startup。
先查看db的模式,命令为:select open_mode,database_role from v$database;
SQL> select open_mode,database_role from v$database;
OPEN_MODE DATABASE_ROLE
-------------------- ----------------
MOUNTED PRIMARY
SQL>
为mount,所以需要open
SQL> alter database open;
Database altered.
SQL>
再去查看新primary的当前数据模式:
SQL> select open_mode,database_role from v$database;
OPEN_MODE DATABASE_ROLE
-------------------- ----------------
READ WRITE PRIMARY
SQL>
角色转换工作完成。剩下的是补救措施(针对原primary 数据库),由于此时primary 数据库已经不再是data guard 配置的一部分,我们需要做的就是尝试看看能否恢复原primary 数据库,将其改造为新的standby服务器。具体操作方式可以分为二类:2.重建2.备份恢复。
----------------------------------------------------------------------------------------------------------------
<版权所有,文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!>
原博客地址: http://blog.itpub.net/26230597/viewspace-1432708/?
原作者:黄杉 (mchdba)
----------------------------------------------------------------------------------------------------------------