分布式协议之两阶段提交协议(2PC)和改进三阶段提交协议(3PC)

一、 事务的ACID

事务是保证数据库从一个一致性的状态永久地变成另外一个一致性状态的根本,其中,ACID是事务的基本特性。

A是Atomicity,原子性。一个事务往往涉及到许多的子操作,原子性则保证这些子操作要么都做,要么都不做,而不至于出现事务的部分操

作成功,而另外一部分操作没有成功。如果事务在执行的过程中发生错误,那么数据库将回滚到事务发生之前的状态。比如银行的转账服务,

这个事务的最终结果一定是:某个账户的余额增加了x,而另外一个账户的余额减少了x,或者两个账户的余额未发生变化。而不会出现其他

情况。

C是Consistency,一致性。一致性是指事务发生前和发生以后,都不会破坏数据库的约束关系,保证了数据库元素的正确性、有效性和完整

性。这种约束关系可以是数据库内部的约束,比如数据库元素的值必须在一定的范围内,也可以是应用带来的约束,比如转账以后银行账户

的余额不能为负数。

I是Isolation,隔离性。一个事务的操作在未提交以前,是不会被并行发生的其他事务访问到的。也就是说,数据库操作不会看到某个事务

的中间操作结果,比如转账过程中,用户是不能查询到一个账户余额减少了,而另外一个账户余额未发生变化的情况。

D是Durability,持久性。事务完成以后,它对数据库的影响是永久性的,即使在数据库系统发生宕机或者其他故障的情况下,这种影响也

会得到保持。

二、 数据库事务性具有ACID4个特性,那么在分布式系统中是怎么保证这4个特性的呢?我们先来看看原子性的实现二阶段提交协议(2PC).

1 二阶段提交(2PC)

  分布式系统的一个难点是如何保证架构下多个节点在进行事务性操作的时候保持一致性。为实现这个目的,二阶段提交算法的成立基于以下假设:

1)该分布式系统中,存在一个节点作为协调者(Coordinator),其他节点作为参与者(Cohorts)。且节点之间可以进行网络通信。

2)所有节点都采用预写式日志,且日志被写入后即被保持在可靠的存储设备上,即使节点损坏不会导致日志数据的消失。

3)所有节点不会永久性损坏,即使损坏后仍然可以恢复。

  第一阶段(投票阶段):

1)协调者节点向所有参与者节点询问是否可以执行提交操作(vote),并开始等待各参与者节点的响应。

2)参与者节点执行询问发起为止的所有事务操作,并将Undo信息和Redo信息写入日志。(注意:若成功这里其实每个参与者已经执行了事务操作)

3)各参与者节点响应协调者节点发起的询问。如果参与者节点的事务操作实际执行成功,则它返回一个"同意"消息;如果参与者节点的事务操作实际执行失败,则它返回一个"中止"消息。

  第二阶段(提交执行阶段):

  当协调者节点从所有参与者节点获得的相应消息都为"同意"时:

1)协调者节点向所有参与者节点发出"正式提交(commit)"的请求。

2)参与者节点正式完成操作,并释放在整个事务期间内占用的资源。

3)参与者节点向协调者节点发送"完成"消息。

4)协调者节点受到所有参与者节点反馈的"完成"消息后,完成事务。

  如果任一参与者节点在第一阶段返回的响应消息为"中止",或者 协调者节点在第一阶段的询问超时之前无法获取所有参与者节点的响应消息时:

1)协调者节点向所有参与者节点发出"回滚操作(rollback)"的请求。

2)参与者节点利用之前写入的Undo信息执行回滚,并释放在整个事务期间内占用的资源。

3)参与者节点向协调者节点发送"回滚完成"消息。

4)协调者节点受到所有参与者节点反馈的"回滚完成"消息后,取消事务。

  不管最后结果如何,第二阶段都会结束当前事务。

  二阶段提交看起来确实能够提供原子性的操作,但是不幸的事,二阶段提交还是有几个缺点的:

  1、执行过程中,所有参与节点都是事务阻塞型的。当参与者占有公共资源时,其他第三方节点访问公共资源不得不处于阻塞状态。

  2、参与者发生故障。协调者需要给每个参与者额外指定超时机制,超时后整个事务失败。(没有多少容错机制)

  3、协调者发生故障。参与者会一直阻塞下去。需要额外的备机进行容错。

  4、二阶段无法解决的问题:协调者再发出commit消息之后宕机,而唯一接收到这条消息的参与者同时也宕机了。那么即使协调者通过选举协议产

生了新的协调者,这条事务的状态也是不确定的,没人知道事务是否被已经提交。

2 三阶段提交协议(3PC)

  与两阶段提交不同的是,三阶段提交有两个改动点。

  1、引入超时机制。同时在协调者和参与者中都引入超时机制。

  2、在第一阶段和第二阶段中插入一个准备阶段。保证了在最后提交阶段之前各参与节点的状态是一致的。

具体流程见下图:

两阶段提交与三阶段提交的区别:

没有任何事情是完美的。特别是在分布式的情况下。事实上,分布式在某个程度上其实是人类社会发展的一个极佳写真。因为人类社会中个体的可靠性显然比分布式系统节点的可靠性要低很多。

三阶段提交也不完美。但是它比两阶段好。

两阶段的问题可以这样分解:

1,协调者出错,参与者也出错;

2,协调者出错,参与者不出错;

3,协调者不出错,参与者出错;

4,协调者不出错,参与者也不出错。

显然第4种不是问题。所以实际上只有3个问题。而问题2可以通过简单地NEW一个新的协调者来解决。问题3的错则显然正是两阶段提交协议的解决目标,所以也没有问题。有问题的只有协调者出错,参与者也出错的问题1。

这种情况可以被进一步分为参与者有没有收到提交的消息。如果参与者没有收到提交的消息,那么显然将不会(或没有---从系统恢复的角度)发生任何真正的提交行为;而如果有任何参与者收到了提交的消息,那么就很可能发生或已经发生了真正的提交行为。这个“可能”,为系统引入了不确定因素。系统没有办法解决这样的问题,唯一的办法便是引入超时机制。否则除了事务没有办法终结以外,部分参与者节点还有可能永不释放其所持有的全部数据锁。

超时机制的引入意味着将两阶段的第二阶段再度分开成两个阶段:不确定阶段与确定阶段。超时以前是不确定操作阶段,超时以后是确定操作阶段。因为在超时发生以前,系统处于不确定阶段,但是超时发生以后,系统则转入确定阶段。超时事件本身,则是系统进行状态转换的信号。但是因为真正引起超时的错只会在协调者与参与者同时出错(对于不出错但超时的情况,视为出错。即超时本身就是一种错---如果超时不“是”错,那么超时机制在这里就不可能工作---这其实就是超时机制的逻辑根本所在。超时是一种错,所以超时可以被用来表示错。如果用一种不是错的信号来表示错,那要区分真正的错就会很困难了)的情况下才会发生,在其它所有的情况下并不会发生,所以必须对这些情况进行相同的状态划分:准备好与提交状态。这些名词并不是很合乎它要表示的语义,但两个状态足够表达所有的情况才是最重要的事情。至于语义,则可以在人的大脑中得到正确的转化。

参考文档:https://en.wikipedia.org/wiki/Three-phase_commit_protocol_ei.cs.vt.edu/~cs5204/fall99/distributedDBMS/sreenu/3pc.html

http://my.oschina.net/digerl/blog/34139

http://blog.csdn.net/shenlan211314/article/details/7283948

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-10 12:24:47

分布式协议之两阶段提交协议(2PC)和改进三阶段提交协议(3PC)的相关文章

关于分布式事务、两阶段提交协议、三阶提交协议

随着大型网站的各种高并发访问.海量数据处理等场景越来越多,如何实现网站的高可用.易伸缩.可扩展.安全等目标就显得越来越重要. 为了解决这样一系列问题,大型网站的架构也在不断发展.提高大型网站的高可用架构,不得不提的就是分布式.在<分布式系统的一致性探讨>一文中主要介绍了分布式系统中存在的一致性问题.本文将简单介绍如何有效的解决分布式的一致性问题,其中包括什么是分布式事务,二阶段提交和三阶段提交. 分布式一致性回顾 在分布式系统中,为了保证数据的高可用,通常,我们会将数据保留多个副本(repli

分布式事务、两阶段提交协议、三阶提交协议

为了解决这种分布式一致性问题,前人在性能和数据一致性的反反复复权衡过程中总结了许多典型的协议和算法.其中比较著名的有二阶提交协议(Two Phase Commitment Protocol).三阶提交协议(Three Phase Commitment Protocol)和Paxos算法. 一.分布式事务 分布式事务是指会涉及到操作多个数据库的事务.其实就是将对同一库事务的概念扩大到了对多个库的事务.目的是为了保证分布式系统中的数据一致性.分布式事务处理的关键是必须有一种方法可以知道事务在任何地方

分布式系统理论之两阶段提交协议

一,两阶段提交协议介绍 两阶段提交协议是用来保证分布式系统事务的协议.在分布式系统中,一个事务需要由多台机器协调完成,机器之间通过网络来通信,如何保证一组操作在多台机器上要么都做,要么都不做呢?(事务的ACID特性) [比如,一个事务包括三个操作A,B,C,操作A,B,C分别 在机器1,2,3上完成,如果机器1成功提交了操作A,机器2成功提交了操作B,但是机器3执行操作C失败了,则需要撤消所有的操作……] 再扩展一下,把两阶段提交协议用到保证多个数据副本一致性的情景下,可以说:它是一种强一致性的

对分布式事务及两阶段提交、三阶段提交的理解

转载至:http://www.cnblogs.com/binyue/p/3678390.html,最近学习需要,先转载方便用用来强化加深印象 一.分布式数据一致性 在分布式系统中,为了保证数据的高可用,通常会将数据保留多个副本(replica),这些副本会放置在不同的物理的机器上. (1)什么是数据一致性 在数据有多份副本的情况下,如果网络.服务器或者软件出现故障,会导致部分副本写入成功,部分副本写入失败.这就造成各个副本之间的数据不一致,数据内容冲突. 造成事实上的数据不一致. (2)CAP定

两阶段提交协议

集中式与分布式事务的另一个重要的不同点在于它们各自所需关注的错误的属性上.在集中式系统中,错误都是要么不错要么全错(all-or-nothing),也就是说要么系统正常工作事务正常处理,要么系统出错不会有任何事务完成.但是在分布式系统中,可能出现部分失败(partial failures)的情况,某些节点正常工作但是其他一些节点出错了. 这种局部失败的情况正是造成分布式系统中很多难解的问题的根源.在事务处理中就有这样的一个难解问题,即分布式事务的一致性问题.比如T就可能在某些节点上进行了Comm

两阶段提交协议的异常处理

详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt371 两阶段提交的协议大家都比较熟悉了,解释一下每个阶段的异常处理.首先,我们需要持久化协议过程中的状态,这样如果server宕机,那么恢复的时候还能通过日志知道宕机前处于那个阶段.同时,所有对数据的修改都会先写write ahead log,保证宕机重启的之后数据也不会丢失.写日志的顺序假定为:写write ahead log-修改缓冲区-写commit/abort lo

分布式事务:两段式提交(最终一致性)

[MySQL如何实现分布式事务?] http://www.linuxidc.com/Linux/2013-10/91925.htm Innodb存储引擎支持XA事务,通过XA事务可以支持分布式事务的实现.分布式事务指的是允许多个独立的事务资源(transac tional resources)参与一个全局的事务中.事务资源通常是关系型数据库系统,也可以是其它类型的资源. 全局事务要求在其中所有参与的事务要么全部提交,要么全部回滚,这对于事务原有的ACID要求又有了提高.另外,在使用分布式事务时候

分布式系统基本概念(一致性、数据分布、复制策略、分布式协议)

分布式系统基本概念 异常类型 1 服务器down机(随时发生.内存数据丢失(因此需要考虑数据持久化).down机重启之后要恢复内存信息) 2 网络异常(消息丢失.消息乱序(UDP)或者网络包数据错误.区域内可通信区域间不可通信) 3 磁盘故障(磁盘损坏(备份).磁盘数据错误(校验和解决)) 超时?不能简单的当做失败(分布式存储的3态成功.失败.超时) 一致性 副本是分布式存储系统容错技术的唯一手段 保证副本之间的一致性是整个分布式系统的理论核心 两个角度理解: 1 用户角度: (1)强一致性:A

分布式事务(两阶段提交)模型详解

详见:http://blog.yemou.net/article/query/info/tytfjhfascvhzxcyt369 这一几天一直在回顾事务相关的知识,也准备把以前了解皮毛的知识进行一些深入总结,虽然这一些知识并没有用到,但是了解其实现原理还是很有必要的,因为知道了原理,你也能把它实现出来. 在上一节事务的编程模型里面,主要说明了三种编程模型,一般情况下,我们都接触的是单一资源的事务,也就是单独对一个数据库进行操作.如果需要跨多个资源保证事务一致性 举个例子:在ATM机取钱的时候,需