CAP原则卡片

CAP 理论 (opens new window)指出在分布式系统中，不可能同时满足以下三点：一致性(Consistency) 、可用性(Avaliability) 、分区容错性(Partition tolerance)。

Alt text

要理解 CAP ，首先要知道节点和分区的概念：

在分布式系统中，每个服务称之为节点，用于存放数据或处理数据，节点间的通信形成一个节点网络。节点网络本应互通，但因为一些故障（网络或机器原因），导致某些节点无法连通，网络将被分割为几块区域。数据散落在这些不连通的区域，形成分区。

Alt text

如果数据仅在一个节点中保存，那么出现分区后，和这个节点不连通的其他分区将无法访问此节点数据，此时分区是不可容忍的。但若把数据复制到多个节点，保证每个分区都有这个数据，那么此时分区就是容错的。

Alt text

但是，将数据复制到多个节点将带来一致性的问题。比如 A1 修改了 B1 的数据，此时 A2 读取 B2 数据时会出现不一致。要保证数据一致性，需要每次写操作的时候保证所有节点写入成功，在此之前的读操作需要等待。

但这又会引入可用性的问题，等待时长越长，可用性越低（ CP 系统） 。要想实现可用性，就不能等待，直接获取节点数据，但这就丧失了一致性（ AP 系统） 。

如果既想可用性，又想一致性，那就保证节点仅存在一个分区，退化为单机系统，但这就丧失了分区容错性 （AC 系统） 。

因此，重新给 CAP 的每一项做下定义：

一句话总结：数据存在的节点越多，分区容错性越高。但数据更新时要变更的节点也越多，一致性就很难保证。为了保证一致性，等待所有节点更新完成的时间就越长，可用性就越差。

# 拓展阅读

上次更新: 2023/08/23, 09:32:05