张大胖和CAP定理(分布式系统、可用性 Availability、一致性 Consistency、分区容错性 Partition tolerance)

原文链接:https://mp.weixin.qq.com/s/J1WH4ZYyVWGgXx9g2siocw

转自:码农翻身(微信号:coderising)

计算机界有很多高大上又难于理解的术语,CAP就是其中之一, 什么一致性(Consistency), 可用性(Availability), 分区容错性(Partition tolerance) 就很难理解了, 再加上CAP定理更是让人云里雾里, 今天咱们试图通俗的演绎一下。

张大胖在公司奋发图强,经过多年的努力,终于做到了架构师的位置。

架构师的椅子还没坐热,很快就来了一个项目要做架构设计。

老板把大胖叫来,谆谆教导说: 大胖啊, 数据是我们的宝贵资产,你设计的系统可千万要保证数据不能丢失啊!

大胖说老板放心, 这方面我有经验, 一般来讲我们要做数据的冗余处理, 简单的来讲就是给数据做多个副本来保存。 我会设计一个分布式系统, 把数据备份到多个机器节点去。

几天后, 大胖给发了一张图, 展示了这个分布式系统是怎么工作的:

数据副本在不同的机器上做冗余, 中间有数据的复制, 保证数据的同步。

虽然只是两台机器, 但是也构成了一个简单的分布式环境。

老板虽然不懂技术, 但是看到数据在不同的机器之间有备份,也就放心了。

经过几个月的开发和测试,可容乃几千人并发的分布式系统顺利上线, 但是大家很快就发现: 分布式系统不像单机系统那么简单, 由于网络的原因, 或者某个机器的原因很容易导致通讯失败,或者节点不可用。

有一天, 用户先访问了左边的机器A , 写入了一条数据, 然后机器A很不幸, 网线被悲催的网管给踢掉了, 这直接导致了两个严重的后果:

  1. 负载均衡找不着机器A,认为它死翘翘了, 就要把用户的下一次访问转到机器B去。
  2. 数据复制也找不着机器A , 只好罢工。 用户刚写入的数据没法复制到机器B,机器B上还是老数据

怎么办? 虽然这是一次偶然, 把网管臭骂一顿, 插上网线就可以了, 但是谁能保证以后两个机器的通信是一致畅通的呢?

组里的小王说: 我们的机器B 还活着呢, 还能提供服务, 数据复制不到机器B, 不就是少看几条数据嘛, 无伤大雅,不影响大局, 勉强可用, 插上网线后数据复制就会工作, 一切就会恢复正常。

小王无意中选择了系统的可用性(Availability,简称A), 系统能提供服务就好, 数据不一致可以忍受。

张大胖说: 不行, 老板说了,我们系统的数据极为重要, 数据如果不一致会带来严重后果,所以机器B上的和这些关键数据相关的功能也必须停掉, 必须等到机器A插上网线,数据同步以后才能开工

很明显, 张大胖遵循老板指示, 把一致性(Consistency, 简称C )放到了首位。

所以问题就很明显了, 在网络节点之间无法通信的情况下, 和数据复制相关的功能, 要么选择可用性(A) , 要么选择一致性©, 不能同时选择两者。

大胖仔细思考了一下, 其实这两种选择的背后其实隐藏着另外一个事实, 那就是网络节点之间无法通信的情况下, 节点被隔离,产生了网络分区, 整个系统仍然是可以工作的, 大胖给它起了个名: 分区容错性(Partition tolerance, 简称P)。

如果选择了可用性(A) + 分区容错性§ , 就要放弃一致性©。

如果选在一致性© + 分区容错性§ , 就得放弃可用性(A) , 对了, 这种情况下,虽然系统的有些功能是不能使用的, 因为需要等待数据的同步, 但是那些和数据同步无关的功能还是可以访问的 , 相当于系统做了功能的降级。

既然有AP和CP, 会不会出现仅仅是CA(一致性+可用性)这种组合呢? 就是没有分区容错性, 只保留可用性和一致性? 仔细想想, 这种情况其实就退化成了单机应用, 没有意义了。

大胖觉得自己似乎发现了一个规律: 在一个分布式计算机系统中,一致性©,可用性(A)和分区容错性§ 这三种保证无法同时得到满足,最多满足两个。

他决定把找个规律叫做CAP定理, 听起来比较高大上, 显得自己高深莫测。

如果你实在是搞不懂这CAP, 张大胖会告诉你一个更容易理解的版本: 在一个分布式系统中, 在出现节点之间无法通信(网络分区产生), 你只能选择 可用性 或者 一致性, 没法同时选择他们。

原文地址:https://www.cnblogs.com/skycto/p/11470221.html

时间: 2024-12-23 07:22:55

张大胖和CAP定理(分布式系统、可用性 Availability、一致性 Consistency、分区容错性 Partition tolerance)的相关文章

分布式系统CAP定理与BASE理论

CAP定理: 一个分布式系统不可能同时满足一致性(C:Consistency).可用性(A:Availability)和分区容错性(P:Partition tolerance)这三个基本要求,最多只能满足其中的两项. 一致性 在分布式环境中,一致性是指数据在多个副本之间是否能够保持强一致的特性. 对于一个将数据副本分布在不同节点上的分布式系统来说,如果对第一个节点的数据进行了更新操作并且更新成功后,却没有使得第二个节点上的数据得到相应的更新,于是在对第二个节点的数据进行读取操作时,获取的依然是更

谈谈对CAP定理的理解

谈谈对CAP定理的理解 CAP定理的常规解释是任何分布式系统只能在一致性(Consitency),可用性(Availability)和分区容忍性(Partition Tolerance)中三选二.这个解释很让人费解,笔者在看了一些文章后谈谈我对它的理解,还请斧正. 从问题出发 假设我们用一台服务器A对外提供存储服务,为了避免这台服务器宕机导致服务不可用,我们又在另外一台服务器B上运行了同样的存储服务.每次用户在往服务器A写入数据的时候,A都往服务器B上写一份,然后再返回客户端.一切都运行得很好,

数据一致性(consistency)、服务可用性(availability)、分区容错性(partition-tolerance)

分布式系统理论基础 - CAP 2016-04-04 18:27 by bangerlee, 135 阅读, 0 评论, 收藏, 编辑 引言 CAP是分布式系统.特别是分布式存储领域中被讨论最多的理论,“什么是CAP定理?”在Quora 分布式系统分类下排名 FAQ 的 No.1.CAP在程序员中也有较广的普及,它不仅仅是“C.A.P不能同时满足,最多只能3选2”,以下尝试综合各方观点,从发展历史.工程实践等角度讲述CAP理论.希望大家透过本文对CAP理论有更多地了解和认识. CAP定理 CAP

CAP定理(原则)以及BASE理论

CAP定理(原则)以及BASE理论 CAP定理(原则)概念 CAP原则又称CAP定理,指的是在一个分布式系统中, Consistency(一致性). Availability(可用性).Partition tolerance(分区容错性),三者不可得兼. 1. 数据一致性(consistency) 一致性(C):在分布式系统中的所有数据备份,在同一时刻是否同样的值.(等同于所有节点访问同一份最新的数据副本) 2. 服务可用性(availability) 可用性(A):在集群中一部分节点故障后,集

CAP定理

from wikipedia CAP定理 CAP定理(CAP theorem),又被称作布鲁尔定理(Brewer's theorem),它指出对于一个分布式计算系统来说,不可能同时满足以下三点: 一致性(Consistency) 可用性(Availability) 容忍网络分区(Partition tolerance) 根据定理,分布式系统只能满足三项中的两项而不可能满足全部三项. 理解CAP理论的最简单方式是想象两个节点分处分区两侧.允许至少一个节点更新状态会导致数据不一致,即丧失了C性质.如

正确理解CAP定理

简介 定义 原文:In a distributed system (a collection of interconnected nodes that share data.), you can only have two out of the following three guarantees across a write/read pair: Consistency, Availability, and Partition Tolerance - one of them must be s

CAP定理(theorem)

一致性(Consistency): 每次读取都会收到最新的写入或错误可用性(Availability): 每个请求都会收到 (非错误) 响应, 但不保证它包含最新的写入分区容差(Partition tolerance): 尽管节点之间的网络删除 (或延迟) 了任意数量的消息, 但系统仍继续运行特别是, cap 定理意味着, 在存在网络分区的情况下, 必须在一致性和可用性之间做出选择.请注意, cap 定理中定义的一致性与 acid 数据库 transactions[4] 中保证的一致性有很大不同

分布式CAP定理,为什么不能同时满足三个特性?

在弄清楚这个问题之前,我们先了解一下什么是分布式的CAP定理. 根据百度百科的定义,CAP定理又称CAP原则,指的是在一个分布式系统中,Consistency(一致性). Availability(可用性).Partition tolerance(分区容错性),最多只能同时三个特性中的两个,三者不可兼得. 一.CAP的定义Consistency (一致性): “all nodes see the same data at the same time”,即更新操作成功并返回客户端后,所有节点在同一

分布式系统的CAP定理

CAP定理: 在一个分布式系统中,Consistency(数据一致性). Availability(服务可用性).Partition tolerance(分区容错性),三者不可兼得. 一致性(Consistency) 在分布式系统中的所有数据备份(副本),在同一时刻数据的值是否一致.(等同于所有节点访问同一份最新的数据副本) 在分布式系统中,更新操作执行成功后所有的用户都应该读到最新的值,等同于所有节点访问同一份最新的数据副本,这样的系统被认为具有强一致性.优点: 数据一致,数据不会出错:缺点: