对Oracle数据库坏块的理解

1.物理坏块和逻辑坏块

在数据库中有一个概念叫做数据块的一致性,Oracle的数据块的一致性包括了两个层次:物理一致性和逻辑一致性,如果一个数据块在这两个层次上存在不一致性,那就对应到了我们今天要要说的物理坏块和逻辑坏块。

在每一个数据块的头部有一个校验和字段,每当数据块要被写回磁盘前,Oracle都会重新计算 这个数据块的校验和,并记录到这个字段最终写会磁盘。下次数据块被读入内存,Oracle会重新 计算数据块的校验和,并和块头的字段相比较,如果有差异,Oracle就知道这个数据块有错误, 会报出ORA-1578错误。    通过校验和字段进行的检查就是物理一致性检查,这个功能可以让Oracle检查到所有底层的错误, 包括磁盘、存储、IO子系统,所以称做物理一致性检查。

在Oracle中每当要修改一个数据块中,会先对数据块内容做一个一致性检查(如检查记录 是否被不存在的食物锁定、记录和索引是否对应等)。如果这种一致性检查失败,就会抛出 ORA-600的Internal错误。当Oracle检查到数据块的逻辑一致性时,会尝试对数据块做 Cache Recovery,如果不能把数据块恢复到一致状态,Oracle就会把这个数据块标志为 Software Corrupt,当有查询访问到这数据块时,也会抛出前面ORA-1578错误。

物理一致性检查利用校验和字段工作,主要侧重于检查硬件故障,并不关心内容正确与否, 而逻辑一致性检查就是侧重于内容的检查,内容检查要比校验和检查复杂的多。 逻辑一致性检查内容要多于物理一致性检查。

2.发生坏块的原因

造成数据块损坏的原因多种多样,可是因为物理原因导致,也可能人为原因或Oracle bug导致。比较常见的人为原因异常关机、掉电、终止服务使进程异常终止,从而破坏数据的完整性,导致坏块的产生。发生数据块损坏的原因时,最典型的表现是遇到ORA-01578错误(比如在全表扫描时),有时也可能是ORA-600内部错误。

3.检查数据块的一致性

(1)使用初始化参数检查数据块的一致性

通过设置初始化参数db_block_checksum=true/false来启用、关闭物理一致性检查,启用该参数这会 增加1%~2%的负载,Oracle推荐启用该参数。在Oracle9i、10g中,默认是启用的。

通过设置参数db_block_checking=true可以启用数据块的逻辑一致性检查。启用该参数这会 增加1%~10%的负载,尤其DML操作越密集性能影响越大。在Oracle10g中这个参数 默认值是false,这将意味这数据库只对System表空间做逻辑一致性检查。

(2)DBV工具对数据块物理/逻辑性检查

详情:http://book.51cto.com/art/201108/287893.htm

(3)analyze命令检查数据块一致性

analyze命令有很多中用法,可以完成很多功能,具体可参考:http://blog.csdn.net/tianlesoftware/article/details/7055164

analyze命令检查对象一致性:   analyze table tablename validate structure cascade online(offline);

该命令同样会执行物理和逻辑一致性检查。除此之外,它还会检查表和索引条目的匹配性,检查分区表的记录是否在正确的分区中, 检查出的问题会放在USER_DUMP_DEST目录的trace文件中。

使用该命令注意一下几个问题:

*当检查分区表的记录是否在正确的分区时,可以把检查出来的记录的ROWID记录在一个特殊表中,这个表叫做invalid_rows,该表需要   使用utlvalid.sql脚本提前建立,检查语法:   analyze tablename validate structure into invalid_rows;

*如果检查索引,这个命令会检查数据块和索引的一致性,但是不会确认每条记录都有相应的索引项或这索引有对应的记录,  如果需要这种检查,需要使用cascade关键字。

*如果使用online子句,可以在DML操作时在线检查一致性,只是这时不会收集对象的统计信息;而如果使用offline表会被锁住。

(4)使用rman工具检查

*检查数据文件
      backup check logical validate [database];
 
     *检查单个数据文件
      backup check logical validate datafile 1,2;
 
     *检查整个库
      backup check logical validate database    检查的结果放在v$database_block_corruption这个动态视图中。

*这个命令对系统性能有一定的影响。

(5)使用dbms_repair.check_object方法执行检查
      详细可参考:http://blog.itpub.net/8494287/viewspace-1357457/

(6)利用exp工具导出整个数据库可以检测坏块

导出命令在执行中会报ORA-01578错误,在这错误提示中会提示那个文件号的文件以及这个文件中的哪个块被损坏,如:ORA—01578:ORACLE 数据块损坏(文件号 4,块号 35)。利用exp工具进行检查坏块也局限性,对一些类型的坏块是检测不出来的如:HWM以上的坏块是不会发现的、索引中存在的坏块是不会发现的、数据字典中的坏块是不会发现的。

-----待续

时间: 2024-08-06 16:02:16

对Oracle数据库坏块的理解的相关文章

12 oracle 数据库坏块--物理坏块-ORA-01578/ORA-01110

oracle 数据库坏块--物理坏块 数据坏块的类型物理坏块:通常是由于硬件损坏如磁盘异常导致.内存有问题.存储链有问题. IO有问题.文件系统有问题. Oracle本身的问题等逻辑坏块:可能都是软件问题导致通常是由于oracle bug导致,比如data block和index block数据不一致第三方软件或者硬件造成的物理损坏物理数据坏块的场景常见的物理坏块(Physical Block Corruptions)有块头和块尾信息不一致(Fractured/Incomplete),check

Oracle数据库坏块的恢复

模拟数据块坏块: 对于发生数据块不一致的数据块,如果当前数据库有备份且处于归档模式,那么就可以利用rman工具数据块恢复功能 对数据块进行恢复,这种方法最简单有效,而且可以在数据文件在线时进行,不会发生数据丢失.对于被有备份的数据库 发生数据块损坏,可能会发生数据的丢失或数据不丢失,这要根据发生坏块的所在的对象决定的,如索引块发生损坏,数据 就不会丢失,重建索引就可以了,发生数据丢失的多发生在表或分区表数据块上. 1.不丢数据的恢复方法 ---使用rman工具的 blockrecover blo

使用BBED模拟Oracle数据库坏块

BBED(OracleBlockBrowerandEDitor Tool),用来直接查看和修改数据文件数据的一个工具,是Oracle一款内部工具,可以直接修改Oracle数据文件块的内容,在一些极端恢复场景下比较有用.该工具不受Oracle支持,所以默认是没有生成可执行文件的,在使用前需要重新连接. 1.安装BBED [[email protected] lib]$ pwd /u02/app/product/10.2.0/db_1/rdbms/lib [[email protected] lib

数据库坏块,怎么办?

在DBA的工作中,应该怎么处理oracle数据库坏块,我介绍一下大概一个思路: 1.检查数据块是否损坏: 利用RMAN对数据库进行备份时: 通过ANALYZE命令对表进行分析时: 通过dbv工具对数据文件进行校验时: 通过SQL命令访问数据文件时. 2.数据库坏块,进行恢复,块介质恢复需求满足以下条件: 数据库的日志模式必须是归档模式,而且数据库服务的状态是open或mount: 对数据库必须进行过0级或full备份,且备份文件是可用的. 数据库的flashback功能必须是enabled: 数

记一次存储故障导致数据库坏块处理过程

记一次存储故障导致数据库坏块处理过程 线上架构说明:     IBM DS4800存储一套     P560小机HA架构一套     两个数据库资源组平时run在HA架构中的任意一台中,资源组全部使用共享存储 问题描述: 由于存储在数据库运行过程中发生了异常宕机,导致两个库存在不同程度的坏块 错误信息及解决过程 数据库A: A:root:/db2dumph/istclhis > 2016-04-09-04.26.10.787138   Instance:istclhis   Node:000 P

【Oracle】 oracle数据库的并发初步理解

先从一个列子来说:我们经常听到说某某网站的每天访问用户数有几十,几千,几百万甚至上千万,同时在线用户数有几万,几十万的. 从这个列子我们来分析,数据库并发的概念. 首先,这儿有两个名词,一个是每天访问的用户数,一个是同时在线用户数.那么这两个数据是不是就是数据库的并发数呢?Oracle数据库的一个相对比较稳定的并发数是200左右,也就是说一台比较好的服务器,并发数在200时,还能够正常的运行,不会死机.由此可见,上面两个数据都不是并发数. 我们再来了解这两个名词的含义. 访问用户数:一个大型的网

oracle数据坏块检测

1.使用dbv检查 D:\oradata\eygle>dbv file=EYGLE.DBF blocksize=8192 DBVERIFY: Release 10.1.0.4.0 - Production on 星期六 6月 11 17:36:37 2005 Copyright (c) 1982, 2004, Oracle.  All rights reserved. DBVERIFY - 开始验证: FILE = EYGLE.DBF 页 219 标记为损坏 Corrupt block rela

Oracle 处理坏块

本文主要介绍如何去处理在Oracle数据库中出现坏块的问题,对于坏块产生在不同的对象上,处理的方法会有所不同,本文将大致对这些方法做一些介绍.因为数据库运行时间长了,由于硬件设备的老化,出现坏块的几率会越来越大,因此,做为一个DBA,怎么去解决数据库出现的坏块问题就成了一个重要的议题了. 什么是数据库的坏块首先我们来大概看一下数据库块的格式和结构 数据库的数据块有固定的格式和结构,分三层:cache layer,transaction layer,data layer.在我们对数据块进行读取写入

数据库坏块触发ora-00600和ora-07445

上午10:03分收到资源同步库的宕机告警,登陆数据库核实数据库确实异常,第一反应手动重启库,但依旧失败. 回过头查看数据库告警日志,发现大量的600和7445报错 查看trace文件,发现都是对同一个表T_PRODUCT_ADDR_6_8_TEMP_AREA的更新操作: 在连续的报错后,数据库自身有个坏块recover的操作 从在线日志恢复成功后,依然有类似的报错信息,最后数据库直接宕机 [分析过程] 1.根据数据库报错信息中涉及的两个数据文件号信息,在数据库启动到mount状态,通过以下脚本查