MySQL数据库的一次死锁实例分析
1、故事起因于2016年11月15日的一个生产bug。业务场景是:归档一个表里边的数据到历史表里边,同是删除主表记录。
2、背景场景简化如下(数据库引擎InnoDb,数据隔离级别RR[REPEATABLE])
--创建表test1 CREATETABLEtest1( idint(11)NOTNULLAUTO_INCREMENT, namevarchar(10)NOTNULL, PRIMARYKEY(id) ); insertintotest1values('hello'); --创建表test2 CREATETABLEtest2( idint(11)NOTNULLAUTO_INCREMENT, namevarchar(10)NOTNULL, PRIMARYKEY(id) ); --Transcation1 begin; insertintotest2select*fromtest1whereid=1; deletefromtest1whereid=1; --Transcation2 begin; insertintotest2select*fromtest1whereid=1;
3、具体执行顺序
Transcation1 | Transcation2 |
begin; —这条sql得到test1表主键索引锁共享锁S(id=1)insertintotest2select*fromtest1whereid=1; |
|
begin; —这条sql试图获取test1表主键索引锁共享锁S(id=1),但是已经被T1占有,所以它进入锁请求队列. insertintotest2select*fromtest1whereid=1; |
|
—这条sql试图把自己拥有的test1表主键索引锁共享锁S(id=1)升级为排它锁X(id=1) —这时T1也发起一个锁请求,这个时候mysql发现锁请求队列里边已存在一个事物T2对(id=1)的这条记录申请了S锁,死锁产生了。 deletefromtest1whereid=1; |
|
死锁产生后mysql根据两个事务的权重,事务2的权重更小,被选为死锁的牺牲者,rollback。 | |
T2rollback之后T1成功获取了锁执行成功 |
Mysql官方解释
DeadlockoccursherebecauseclientAneedsanXlocktodeletetherow.However,thatlockrequestcannotbegrantedbecauseclientBalreadyhasarequestforanXlockandiswaitingforclientAtoreleaseitsSlock.NorcantheSlockheldbyAbeupgradedtoanXlockbecauseofthepriorrequestbyBforanXlock.Asaresult,InnoDBgeneratesanerrorforoneoftheclientsandreleasesitslocks.Theclientreturnsthiserror。
实际场景和mysql文档有些区别,文档里边要获取的是X锁。具体事例里边要获取的是S锁。
下面我们来具体的一步步分析下mysql的死锁
1、MySQL常用存储引擎的锁机制
MyISAM和MEMORY采用表级锁(table-levellocking)
BDB采用页面锁(page-levellocking)或表级锁,默认为页面锁
InnoDB支持行级锁(row-levellocking)和表级锁,默认为行级锁
2、各种锁特点
表级锁:开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低
行级锁:开销大,加锁慢;会出现死锁;锁定粒度最小,发生锁冲突的概率最低,并发度也最高
页面锁:开销和加锁时间界于表锁和行锁之间;会出现死锁;锁定粒度界于表锁和行锁之间,并发度一般
3、各种锁的适用场景
表级锁更适合于以查询为主,只有少量按索引条件更新数据的应用,如Web应用
行级锁则更适合于有大量按索引条件并发更新数据,同时又有并发查询的应用,如一些在线事务处理系统
4、死锁
是指两个或两个以上的进程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。
表级锁不会产生死锁。所以解决死锁主要还是针对于最常用的InnoDB。
5、死锁举例分析
在MySQL中,行级锁并不是直接锁记录,而是锁索引。索引分为主键索引和非主键索引两种,如果一条sql语句操作了主键索引,MySQL就会锁定这条主键索引;如果一条语句操作了非主键索引,MySQL会先锁定该非主键索引,再锁定相关的主键索引。
在UPDATE、DELETE操作时,MySQL不仅锁定WHERE条件扫描过的所有索引记录,而且会锁定相邻的键值,即所谓的next-keylocking。
例如,一个表db。tab_test,结构如下:
id:主键;
state:状态;
time:时间;
索引:idx_1(state,time)
出现死锁日志如下:
?***(1)TRANSACTION: ?TRANSACTION0677833455,ACTIVE0sec,processno11393,OSthreadid278546startingindexread ?mysqltablesinuse1,locked1 ?LOCKWAIT3lockstruct(s),heapsize320 ?MySQLthreadid83,queryid162348740dcnet03dcnetSearchingrowsforupdate ?updatetab_testsetstate=1064,time=now()wherestate=1061andtime<date_sub(now(),INTERVAL30minute)(任务1的sql语句) ?***(1)WAITINGFORTHISLOCKTOBEGRANTED:(任务1等待的索引记录) ?RECORDLOCKSspaceid0pageno849384nbits208index`PRIMARY`oftable`db/tab_test`trxid0677833455_modeXlocksrecbutnotgapwaiting ?Recordlock,heapno92PHYSICALRECORD:n_fields11;compactformat;infobits0 ?0:len8;hex800000000097629c;ascb;;1:len6;hex00002866eaee;asc(f;;2:len7;hex00000d40040110;asc@;;3:len8;hex80000000000050b2;ascP;;4:len8;hex800000000000502a;ascP*;;5:len8;hex8000000000005426;ascT&;;6:len8;hex800012412c66d29c;ascA,f;;7:len23;hex75706c6f6164666972652e636f6d2f68616e642e706870;ascxxx.com/;;8:len8;hex800000000000042b;asc+;;9:len4;hex474bfa2b;ascGK+;;10:len8;hex8000000000004e24;ascN$;; ?***(2)TRANSACTION: ?TRANSACTION0677833454,ACTIVE0sec,processno11397,OSthreadid344086updatingordeleting,threaddeclaredinsideInnoDB499 ?mysqltablesinuse1,locked1 ?3lockstruct(s),heapsize320,undologentries1 ?MySQLthreadid84,queryid162348739dcnet03dcnetUpdatingupdatetab_testsetstate=1067,time=now()whereidin(9921180)(任务2的sql语句) ?***(2)HOLDSTHELOCK(S):(任务2已获得的锁) ?RECORDLOCKSspaceid0pageno849384nbits208index`PRIMARY`oftable`db/tab_test`trxid0677833454lock_modeXlocksrecbutnotgap ?Recordlock,heapno92PHYSICALRECORD:n_fields11;compactformat;infobits0 ?0:len8;hex800000000097629c;ascb;;1:len6;hex00002866eaee;asc(f;;2:len7;hex00000d40040110;asc@;;3:len8;hex80000000000050b2;ascP;;4:len8;hex800000000000502a;ascP*;;5:len8;hex8000000000005426;ascT&;;6:len8;hex800012412c66d29c;ascA,f;;7:len23;hex75706c6f6164666972652e636f6d2f68616e642e706870;ascuploadfire.com/hand.php;;8:len8;hex800000000000042b;asc+;;9:len4;hex474bfa2b;ascGK+;;10:len8;hex8000000000004e24;ascN$;; ?***(2)WAITINGFORTHISLOCKTOBEGRANTED:(任务2等待的锁) ?RECORDLOCKSspaceid0pageno843102nbits600index`idx_1`oftable`db/tab_test`trxid0677833454lock_modeXlocksrecbutnotgapwaiting ?Recordlock,heapno395PHYSICALRECORD:n_fields3;compactformat;infobits0 ?0:len8;hex8000000000000425;asc%;;1:len8;hex800012412c66d29c;ascA,f;;2:len8;hex800000000097629c;ascb;; ?***WEROLLBACKTRANSACTION(1) ?(回滚了任务1,以解除死锁)
原因分析:
当“updatetab_testsetstate=1064,time=now()wherestate=1061andtime<date_sub(now(),INTERVAL30minute)”执行时,MySQL会使用idx_1索引,因此首先锁定相关的索引记录,因为idx_1是非主键索引,为执行该语句,MySQL还会锁定主键索引。
假设“updatetab_testsetstate=1067,time=now()whereidin(9921180)”几乎同时执行时,本语句首先锁定主键索引,由于需要更新state的值,所以还需要锁定idx_1的某些索引记录。
这样第一条语句锁定了idx_1的记录,等待主键索引,而第二条语句则锁定了主键索引记录,而等待idx_1的记录,这样死锁就产生了。
6、解决办法
拆分第一条sql,先查出符合条件的主键值,再按照主键更新记录:
selectidfromtab_testwherestate=1061andtime<date_sub(now(),INTERVAL30minute); updatetab_teststate=1064,time=now()whereidin(......);
关于MySQL死锁问题的实例分析及解决方法就介绍到这里了,希望本次的介绍能够对您有所收获!
Mysql官方文档:http://dev.mysql.com/doc/refman/5.7/en/innodb-deadlock-example.html