MySQL 主从同步,事务回滚的实现原理
BinLog
BinLog是记录所有数据库表结构变更(例如create、altertable)以及表数据修改(insert、update、delete)的二进制日志,主从数据库同步用到的都是BinLog文件。BinLog日志文件有三种模式。
STATEMENT模式
内容:binlog只会记录引起数据变更的sql语句
优势:该模式下,因为没有记录实际的数据,所以日志量和IO都消耗很低,性能是最优的
劣势:但有些操作并不是确定的,比如uuid()函数会随机产生唯一标识,当依赖binlog回放时,该操作生成的数据与原数据必然是不同的,此时可能造成无法预料的后果。
ROW模式
内容:在该模式下,binlog会记录每次操作的源数据与修改后的目标数据,StreamSets就要求该模式。
优势:可以绝对精准的还原,从而保证了数据的安全与可靠,并且复制和数据恢复过程可以是并发进行的
劣势:缺点在于binlog体积会非常大,同时,对于修改记录多、字段长度大的操作来说,记录时性能消耗会很严重。阅读的时候也需要特殊指令来进行读取数据。
MIXED模式
内容:是对上述STATEMENT跟ROW两种模式的混合使用。
细节:对于绝大部分操作,都使用STATEMENT来进行binlog的记录,只有以下操作使用ROW来实现:表的存储引擎为NDB,使用了uuid()等不确定函数,使用了insertdelay语句,使用了临时表
主从同步流程:
1、主节点必须启用二进制日志,记录任何修改了数据库数据的事件。
2、从节点开启一个线程(I/OThread)把自己扮演成mysql的客户端,通过mysql协议,请求主节点的二进制日志文件中的事件。
3、主节点启动一个线程(dumpThread),检查自己二进制日志中的事件,跟对方请求的位置对比,如果不带请求位置参数,则主节点就会从第一个日志文件中的第一个事件一个一个发送给从节点。
4、从节点接收到主节点发送过来的数据把它放置到中继日志(Relaylog)文件中。并记录该次请求到主节点的具体哪一个二进制日志文件内部的哪一个位置(主节点中的二进制文件会有多个)。
5、从节点启动另外一个线程(sqlThread),把Relaylog中的事件读取出来,并在本地再执行一次。
mysql默认的复制方式是异步的,并且复制的时候是有并行复制能力的。主库把日志发送给从库后不管了,这样会产生一个问题就是假设主库挂了,从库处理失败了,这时候从库升为主库后,日志就丢失了。由此产生两个概念。
- 全同步复制
主库写入binlog后强制同步日志到从库,所有的从库都执行完成后才返回给客户端,但是很显然这个方式的话性能会受到严重影响。
- 半同步复制
半同步复制的逻辑是这样,从库写入日志成功后返回ACK确认给主库,主库收到至少一个从库的确认就认为写操作完成。
RedoLog
binlog跟redolog区别:
- redolog是InnoDB引擎特有的;binlog是MySQL的Server层实现的,所有引擎都可以使用。
- redolog是物理日志,记录的是在某个数据页上做了什么修改;binlog是逻辑日志,记录的是这个语句的原始逻辑,比如给ID=2这一行的c字段加1。
- redolog是循环写的,空间固定会用完;binlog是可以追加写入的。追加写是指binlog文件写到一定大小后会切换到下一个,并不会覆盖以前的日志。
在MySQL中如果每一次的更新操作都需要写进磁盘,然后磁盘也要找到对应的那条记录,然后再更新,整个过程IO成本、查找成本都很高。先写日志,再写磁盘BinLog,RedoLog。
1、记录更新时,InnoDB引擎就会先把记录写到RedoLog(里面,并更新内存。同时,InnoDB引擎会在空闲时将这个操作记录更新到磁盘里面。
2、如果更新太多RedoLog处理不了的时候,需先将RedoLog部分数据写到磁盘,然后擦除RedoLog部分数据。
RedoLog的writepos跟checkpoint
RedoLog有writepos跟checkpoint
writepos:是当前记录的位置,一边写一边后移,写到第3号文件末尾后就回到0号文件开头。
checkpoint:缩短数据库的恢复时间,bufferpool空间不够用时,将脏页刷新到磁盘,redolog不可用时,刷新脏页
redolog顺序写实际上是循环写固定几个文件,写满一轮就要从头开始覆盖。它包括两个位点,checkpoint和writepos,writepos是写到那个位置了,循环往后递增,checkpoint是当前要擦除的位置。二者中间的空间是可写入的,当writepos追上checkpoint时,就会先停下更新,覆盖掉一些记录,然后继续写入redolog。
redolog的crash-safe
MySQL支持用户自定义在commit时如何将logbuffer中的日志刷logfile中。这种控制通过变量innodb_flush_log_at_trx_commit的值来决定。该变量有3种值:0、1、2,默认为1。但注意,这个变量只是控制commit动作是否刷新logbuffer到磁盘。
- 当设置为1的时候,事务每次提交都会将logbuffer中的日志写入osbuffer并调用fsync()刷到logfileondisk中。这种方式即使系统崩溃也不会丢失任何数据,但是因为每次提交都写入磁盘,IO的性能较差。
- 当设置为0的时候,事务提交时不会将logbuffer中日志写入到osbuffer,而是每秒写入osbuffer并调用fsync()写入到logfileondisk中。也就是说设置为0时是(大约)每秒刷新写入到磁盘中的,当系统崩溃,会丢失1秒钟的数据。
- 当设置为2的时候,每次提交都仅写入到osbuffer,然后是每秒调用fsync()将osbuffer中的日志写入到logfileondisk。
在主从复制结构中,要保证事务的持久性和一致性,需要对日志相关变量设置为如下:
- 如果启用了二进制日志,则设置sync_binlog=1,即每提交一次事务同步写到磁盘中。
- 总是设置innodb_flush_log_at_trx_commit=1,即每提交一次事务都写到磁盘中。
上述两项变量的设置保证了:每次提交事务都写入二进制日志和事务日志,并在提交时将它们刷新到磁盘中。
有了redolog,InnoDB就可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,这个能力称为crash-safe。redolog两阶段提交`:为了让binlog跟redolog两份日志之间的逻辑一致。提交流程大致如下:
1prepare阶段-->2写binlog-->3commit
1.当在2之前崩溃时,重启恢复后发现没有commit,回滚。备份恢复:没有binlog。一致
2.当在3之前崩溃时,重启恢复发现虽没有commit,但满足prepare和binlog完整,所以重启后会自动commit。备份:有binlog.一致
UndoLog
undolog有两个作用:提供回滚和多个行版本控制(MVCC).主要分为两种
在数据修改的时候,不仅记录了redo,还记录了相对应的undo,如果因为某些原因导致事务失败或回滚了,可以借助该undo进行回滚。当delete一条记录时,undolog中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。
当执行rollback时,就可以从undolog中的逻辑记录读取到相应的内容并进行回滚
- insertundolog
代表事务在insert新记录时产生的undolog,只在事务回滚时需要,并且在事务提交后可以被立即丢弃
- updateundolog
事务在进行update或delete时产生的undolog;不仅在事务回滚时需要,在快照读时也需要;所以不能随便删除,只有在快速读或事务回滚不涉及该日志时,对应的日志才会被purge线程统一清除
以上就是MySQL主从同步,事务回滚的实现原理的详细内容,更多关于MySQL主从同步,事务回滚的资料请关注毛票票其它相关文章!