enq: TX - row lock contention故障处理一则

一个非常easy的问题,之所以让我对这个问题进行总结。一是由于没我想象的简单,在处理的过程中遇到了一些磕磕碰碰,甚至绕了一些弯路。二是引发了我对故障处理时的一些思考。

6月19日,下午5点左右。数据库出现了大量的enq: TX - row lock contention等待事件,依照以往的经验,这类等待一般与业务逻辑有关。DBA可以做的事情。一般就是将锁等待着的连接信息,等待锁的SQL语句。甚至等待的详细数据行,还有就是锁持有者的连接信息,造成锁等待的SQL语句等一些基本信息提交给开发者,改动业务逻辑。

注意

  • 非常多情况下,改动业务逻辑不是一时半会能够马上解决的事,有时候假设锁持有或者锁等待业务不是特别重要。能够与应用维护人员协商,先停掉这部分业务,让其他业务正常执行
  • 非常多时候。数据库仅仅有一个锁持有者。并且这个锁持有的连接也没有活动,能够与应用维护人员协商,尝试kill锁持有者,看看兴许锁等待是否能自己主动解决。

    这样的情况通常是一个单独的连接出现僵死导致。kill掉持有者以后,问题自然就攻克了

  • 第二种情况就是,前天晚上上线后,平时执行好好的业务,也没出现锁等待。有一天出现了这类问题。并且kill掉锁持有者以后。问题无法得到解决(业务逻辑问题,kill掉以后,兴许还会发生)。这通常是前天晚上上线引起。

本来认为数据库层提供信息非常easy。结果与想象的有点差别,来看一下详细的过程

(1)查询锁信息。例如以下

SESS LMODE LMODE REQUEST TYPE EVENT SQL_TEXT
Holder: 4266 exclusive 6 0 TX SQL*Net message from client  
Waiter: 3136 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 2276 exclusive 6 0 TX SQL*Net message from client  
Waiter: 1716 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 1288 exclusive 6 0 TX SQL*Net message from client  
Waiter: 1565 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 1000 exclusive 6 0 TX SQL*Net message from client  
Waiter: 1147 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")
Holder: 2989 exclusive 6 0 TX SQL*Net message from client  
Waiter: 862 none 0 4 TX enq: TX - row lock contention insert into xxxxx(ID,xxx,xxxx,xxx,….) values(seq_xxx.nextval,:"SYS_B_0",:"SYS_B_1",:"SYS_B_2",:"SYS_B_3",:"SYS_B_4",:"SYS_B_5")

备注:表名和列名做了模糊化

能够看到,锁等待语句正在等待Insert条记录

(2)通过查看锁持有者,已经运行的语句,来推断究竟是那个语句造成了锁等待,查询语句例如以下:

select b.sql_text ,a.* from v$open_cursor a,v$sql b  where a.sql_id=b.sql_id and a.sid=4266 and  upper(b.sql_text) like ‘%xxxxx%‘;

(3)

依据经验insert一条语句被堵塞,通常是因为主键约束引起(还有一个连接也插入了同一条语句或者删除了一条语句,可是没有提交)

可是我通过上面的语句查询的时候。发现怎么也找不到锁持有者有运行过这个表的不论什么DML,并且询问开发者,他们也说没有对这张表的DML操作

当中open_cursor为1000,v$open_cursor中的记录也远远没有达到这个数,才100条不到。

session_cached_cursors设置为200。没有道理这个连接运行的语句游标已经被刷新出去

(4)还真没有遇到过类似的问题。怎么也找不到。这时我换了一个想法。抛开那些经验。我在想,是不是有一种可能不正确Insert插入语句进行不论什么DML操作,也会造成一条插入语句被锁掉??

我考虑了这张表的依赖对象是不是会造成种类等待,比如触发器、外键引用等等。

细致考虑一番,发现触发器,审计什么的,数据库应该能定位到详细的语句,而不是发生在这个insert语句本身(就算是递归语句。Oracle也能捕获到才对),因此,最让我怀疑的就是外键引用。通过以下这个查询。推断是否这个表通过外键引用了其它对象,例如以下

select a.table_name,

a.owner,

a.constraint_name,

a.constraint_type,

a.r_owner,

a.r_constraint_name,--被外键引用的约束名

b.table_name  --被外键引用的表名

from dba_constraints a, dba_constraints b

where a.constraint_type = ‘R‘

and a.r_constraint_name = b.constraint_name

and a.r_owner = b.owner

and b.table_name = ‘xxxxx‘

and b.owner=‘‘;

查询发现,确实有一张表引用这个插入等待的表,这时,顿时感觉希望非常大。

(5)通过一个简单的測试,我验证我的猜測。例如以下

create table t3 (id number primary key,name varchar2(20),product_id number);

create table t2 (id number primary key,name varchar2(20));

alter table t3 add constraint FK_PRODUCTSTAT_PRODUCTID foreign key (PRODUCT_id) references t2 (ID);

SQL> insert into t2 values(1,‘dh‘);

1 row inserted

SQL>  insert into t2 values(2,‘cc‘);

1 row inserted

SQL> insert into t2 values(3,‘cc‘);

1 row inserted

SQL> commit;

Commit complete

session 1运行例如以下操作:

SQL> select * from t2;

ID NAME

---------- --------------------

1 dh

2 cc

3 cc

SQL> select * from t3;

ID NAME                 PRODUCT_ID

---------- -------------------- ----------    --能够看到,这时t3表有不论什么记录

SQL>  insert into t2 values(4,‘cc‘);    --对父表运行一条插入

1 row inserted、

session2 t2表运行一条插入操作,例如以下

insert into t3 values(1,‘tt‘,4);

令人惊喜的是,确实发生了锁等待。与我们遇到的锁等待类型一模一样。

(6)查询锁持有者。是否有对锁等待表的父表有进行DML操作。例如以下

select b.sql_text ,a.* from v$open_cursor a,v$sql b  where a.sql_id=b.sql_id and a.sid=4266 and  upper(b.sql_text) like ‘%xxxxx_ref%‘;

检查结果与我们预期的一致,确实有非常多对主表的插入操作!

(7)基本我们已经确定是什么语句导致锁阻塞,将语句提交给开发者。改动代码后,问题解决!

问题总结

事实上这个问题本身不难。值得思考的是,为什么一个这么简单的问题,无法马上找到原因。说究竟。非常多时候都是经验束缚了我们,在遇到这类问题时。我们须要抛开已有的那些经验。通过数据库的原理来发现根本原因。因此,理论知识再怎么强调都只是分,它真的非常重要。理解了原理,你才干够举一反三。游刃有余,而不是每次一碰到没见过的问题都战战兢兢!

时间: 2024-07-29 14:41:56

enq: TX - row lock contention故障处理一则的相关文章

ORACLE等待事件:enq: TX - row lock contention

enq: TX - row lock contention等待事件,这个是数据库里面一个比较常见的等待事件.enq是enqueue的缩写,它是一种保护共享资源的锁定机制,一个排队机制,先进先出(FIFO).enq: TX - row lock contention等待事件,OACLE将其归类为application级别的等待事件.有些场景是因为应用逻辑设计不合理造成的.下面我们看看enq: TX - row lock contention的英文介绍: This wait indicates ti

enq: TX - row lock contention 参数P1,P2,P3的讲解

enq: TX - row lock contention等待事件的三个参数如下 * P1 = name|mode          <<<<<<<<<<<<< name一般都为0x5458代表TX锁; mode为4代表共享锁 mode为6代表排他锁 * P2 = usn<<16 | slot      <<<<<<<<<<<<< v$tr

enq: TX - row lock contention 参数P1,P2,P3说明

enq: TX - row lock contention三个参数,例如,下面的等待事件 * P1 = name|mode          <<<<<<< name一般都为0x5458代表TX锁; mode为4代表共享锁 mode为6代表排他锁 * P2 = usn<<16 | slot      <<<<<<< v$transaction.xidusn  和 v$transaction.xidslot *

[Oracle] enq: TX - row lock contention 优化案例

根据开发反馈,最近每天早上7:30应用会报警,应用的日志显示数据库连接池满了,新的连接被拒绝. 首先,我做了ASH报告(报告区间:7:25 ~ 7:35),从ASH的等待事件发现enq: TX - row lock contention居然高达76.54%,如下所示: Top User Events Event Event Class % Event Avg Active Sessions enq: TX - row lock contention Application 76.54 0.81

ORACLE AWR结合ASH诊断分析enq: TX - row lock contention

公司用户反馈一系统在14:00~15:00(2016-08-16)这个时间段反应比较慢,于是生成了这个时间段的AWR报告, 如上所示,通过Elapsed Time和DB Time对比分析,可以看出在这段时间内服务器并不繁忙.分析Top 5 Timed Events,我们可以看到前五的等待事件 可以看到等待事件enq: TX - row lock contention占了所有等待事件17.3%的比例,猜测有可能是锁等待(enqueue等待)引起的阻塞导致,但是这个还不能下定论,因为毕竟CPU Ti

【转载】TX - row lock contention 的一些场景

TX - row lock contention 的一些场景 原创 2016-07-11 易欣 云和恩墨 易欣(Eson) 云和恩墨技术专家 本文整理来自7月7日周四晚云和恩墨大讲堂嘉宾易欣分享的主题:TX - row lock contention 的一些场景,供大家参考. 概述 在数据库运维过程中,enq: TX - row lock contention 是一个常见的等待事件,特别是 RAC 环境下.对于 enq: TX - row lock contention 等待事件,Oracle

解决enq: TX - index contention的常用方法

摘自: Troubleshooting 'enq: TX - index contention' Waits (Doc ID 873243.1) o  Rebuild the index  as reverse key indexes or hash partition the indexes which are listed in the 'Segments by Row Lock Waits' of the AWR reports o  Consider increasing the CAC

SQL Server中如何定位Row Lock锁定哪一行数据

在SQL Server中有时候会使用提示(Hint)强制SQL使用行锁(Row Lock),前两天有个同事咨询了一个问题,如何定位Row Lock具体锁定了哪一行.其实这个问题只适合研究一下,实际意义并不大,因为找到.定位被锁定的行的代价开销较大,而意义却不怎么大,而且使用场景也很少.那么下面我们来探讨.研究一下这个问题吧: 在会话窗口(会话ID=65)下执行下面SQL语句,模拟SQL Server使用行锁锁定某一行记录: USE AdventureWorks2012; GO   SELECT 

16、lock

lock锁的相关概念latch锁的粒度表锁tm模拟一个被锁住的情况,分析阻塞源头.模拟环境分析锁的源头的过程oracle数据库的锁锁的兼容性系统夯住怎么办1,查到进程号,直接用操作系统杀死进程.2.使用oradebug3.sqlplus -prelim / as sysdba4.gdb lock 锁的相关概念 sga区叫共享全局区(系统共享区)很多个进程都可以访问. 使用锁来解决共享资源的并发问题.锁一般是个内存结构. latch 提到锁来回顾一下latch锁.latch是个内存结构. 要修改数