解决Oracle ERP死锁的方法

on

今天,功能顾问说客户在作付款的时候忽然客户端掉电,然后再次登录以后就无法继续付款了,报错界面如下。

付款报错

明显是意外掉电导致的客户端进程没有释放,所以产生了始终不释放的lock。

如果对于业务比较熟悉,知道这是哪个form,问清楚客户使用的什么职责,通常从vlock和vsession中就可以得到足够的信息,然后kill掉产生lock的会话就可以了。

但是如果对于业务不熟悉就只能依靠Oracle RDBMS的知识一点点检查了,我的解决方法基本上是这样。

1。为发生错误的Form加上跟踪

2。重现错误,在udump目录下查看trace文件

3。找到这样的报错
PARSING IN CURSOR #70 len=120 dep=0 uid=44 oct=3 lid=44 tim=2502449707361 hv=3320467580 ad=’99f21c88′
SELECT LAST_DOCUMENT_NUM + 1 FROM AP_CHECK_STOCKS WHERE CHECK_STOCK_ID = :b1 FOR UPDATE OF LAST_DOCUMENT_N
UM NOWAIT
END OF STMT
PARSE #70:c=0,e=2425,p=0,cr=2,cu=0,mis=1,r=0,dep=0,og=0,tim=2502449707353
WAIT #70: nam=’SQL*Net message to client’ ela= 2 p1=1952673792 p2=1 p3=0
WAIT #70: nam=’SQL*Net message from client’ ela= 356 p1=1952673792 p2=1 p3=0
BINDS #70:
bind 0: dty=2 mxl=23(22) mal=00 scl=00 pre=00 oacflg=03 oacfl2=0 size=24 offset=0
bfp=800003fb8005b6f8 bln=23 avl=04 flg=05
value=10094
EXEC #70:c=0,e=1159,p=0,cr=7,cu=1,mis=0,r=0,dep=0,og=4,tim=2502449709034
ERROR #70:err=54 tim=256250850

4。确认err=54是资源繁忙的错误
oerr ora 54
00054, 00000, “resource busy and acquire with NOWAIT specified”
// *Cause: Resource interested is busy.
// *Action: Retry if necessary.

5。查看dba_objects和vlocked_object,找到对SQL中的表加锁的SESSION_ID,然后kill这个会话。
这一步需要注意的是,Oracle ERP系统中使用了大量的带有CLIENT_INFO环境参数的视图,比如本例中的AP_CHECK_STOCKS就是一个视图,所以直接从v$locked_object里面是查不到锁定视图的会话的,所以通常我们还需要找到这个视图的定义,然后查询视图使用的基表。

7 Comments Add yours

  1. lunar says:

    我也经常处理锁,和你们不同的是,我们这里一锁表(其实应该是行锁造成的应用业务拥堵更明显),我通常看两个vsession_wait中一定有enqueue等待事件,通过这个可以找到对象;另外,vlock中一定有block=1的会话,可以找到这个会话信息,然后kill session就好了,呵呵。

  2. 土堆 says:

    commonly ,i ask our users to logoff the system and then check the locks throuh OEM,…

  3. kamus says:

    to 土堆
    一个用户被锁了,就要全部用户退出,偶们这边的客户会急的,呵呵。

    to lunar
    v$lock中一定有block=1,恩,是比较简单的检查方法,但是block=1不一定就说明这个session能被kill掉哦,也许是一个正常的session,只是执行的比较慢,所以block了后续相同的lock请求。

  4. vecentli says:

    v$session中有记载form的客户端信息,根据报错的机器名,kill掉即可.

  5. kamus says:

    vecentli on May 1, 2006 at 11:35 am said:

    v$session中有记载form的客户端信息,根据报错的机器名,kill掉即可.

    报错的机器很多时候是需要进行正常操作的会话,而block了这个请求的会话可能是其它的客户端,所以kill报错的会话往往不能解决问题。
    当然在本例中你说的这个方法应该有用。

  6. Alicechen says:

    kamus
    你好!能否提供下完整的解决方法,tks!

Leave a Reply

Your email address will not be published. Required fields are marked *