当前位置：Gxlcms > 数据库问题 > CAP理论与MongoDB一致性、可用性的一些思考

CAP理论与MongoDB一致性、可用性的一些思考

时间：2021-07-01 10:21:17 帮助过：62人阅读

。相反，如果被分区的是内在关系密切的状态，或者有某些全局性的不变性约束非保持不可，那么最好的情况是只有分区一侧可以进行操作，最坏情况是操作完全不能进行。

　　上面摘录中下选线部分跟MongoDB的sharding情况就很相似，MongoDB的sharded cluste模式下，shard之间在正常情况下，是无需相互通信的。

　　在13年的文章中《better-explaining-cap-theorem》，作者指出“it is really just A vs C！”，因为

　　（1）可用性一般是在不同的机器之间通过数据的复制来实现

　　（2）一致性需要在允许读操作之间同时更新几个节点

　　（3）temporary partion，即几点之间的通信延迟是可能发生了，此时就需要在A 和 C之间权衡。但只有在发生分区的时候才需要考虑权衡。

　　在分布式系统中，网络分区一定会发生，因此“it is really just A vs C！”

MongoDB与CAP

　　在《通过一步步创建sharded cluster来认识MongoDB》一文中，对MongoDB的特性做了一些介绍，包括高性能、高可用、可扩展（水平伸缩），其中，MongoDB的高可用性依赖于replica set的复制与自动failover。对MongoDB数据库的使用有三种模式：standalone，replica set， shareded cluster，在前文中详细介绍了shared cluster的搭建过程。　　standalone就是单个mongod，应用程序直接连接到这个Mongod，在这种情况下无分区容错性可言，也一定是强一致性的。对于sharded cluster，每一个shard也都推荐是一个replica set。MongoDB中的shards维护的是独立的数据子集，因此shards之间出现了分区影响不大（在chunk迁移的过程可能还是有影响），因此也主要考虑的是shard内部replica set的分区影响。所以，本文中讨论MongoDB的一致性、可用性问题，针对的也是MongoDB的replica set。　　对于replica set，只有一个primary节点，接受写请求和读请求，其他的secondary节点接受读请求。这是一个单写、多读的情况，比多读、多写的情况还是简化了许多。后文为了讨论，也是假设replica set由三个基点组成，一个primary，两个secondary，且所有节点都持久化数据（data-bearing）　　MongoDB关于一致性、可用性的权衡，取决于三者：write-concern、read-concern、read-preference。下面主要是MongoDB3.2版本的情况，因为read-concern是在MongoDB3.2版本中才引入的。

write-concern：

　　write concern表示对于写操作，MongoDB在什么情况下给予客户端响应。包括下面三个字段：

　　{ w: <value>, j: <boolean>, wtimeout: <number> }

　　w: 表示当写请求在value个MongoDB实例处理之后才向客户端返回。取值范围：　　　　1：默认值，表示数据写入到standalone的MongoDB或者replica set的primary之后返回　　　　0：不用写入就直接向客户端返回，性能高，但可能丢数据。不过可以配合j：True来增加数据的可持久性（durability）　　　　>1: 只有在replica set环境下才有用，如果value大于的replica set中节点的数目，那么可能导致阻塞　　　　‘majority’：当数据写入到replica set的大多数节点之后向客户端返回，对于这种情况，一般是配合read-concern使用：

　　　　After the write operation returns with a w: "majority" acknowledgement to the client, the client can read the result of that write with a "majority" readConcern

　　j：表示当写请求在写入journal之后才向客户端返回，默认为False。两点注意：　　　　如果在对于未开启journaling的MongoDB实例使用j:True，会报错　　　　在MongoDB3.2及之后，对于w>1, 需要所有实例都写到journal之后才返回　　wtimeout：表示写入的超时时间，即在指定的时间（number），如果还不能向客户端返回（w大于1的情况），那么返回错误　　　　默认为0，相当于没有设置该选项　　在MongoDB3.4中，加入了writeConcernMajorityJournalDefault.这么一个选项，使得w，j在不同的组合下情况下不同: 　　技术分享

read-reference:

　　在前文已经讲解过，一个replica set由一个primary和多个secondary组成。primary接受写操作，因此数据一定是最新的，secondary通过oplog来同步写操作，因此数据有一定的延迟。对于时效性不是很敏感的查询业务，可以从secondary节点查询，以减轻集群的压力。

　　技术分享

　　MongoDB指出在不同的情况下选用不同的read-reference，非常灵活。MongoDB driver支持一下几种read-reference：

　　primary：默认模式，一切读操作都路由到replica set的primary节点

　　primaryPreferred：正常情况下都是路由到primary节点，只有当primary节点不可用（failover）的时候，才路由到secondary节点。

　　secondary：一切读操作都路由到replica set的secondary节点

　　secondaryPreferred：正常情况下都是路由到secondary节点，只有当secondary节点不可用的时候，才路由到primary节点。

　　nearest：从延时最小的节点读取数据，不管是primary还是secondary。对于分布式应用且MongoDB是多数据中心部署，nearest能保证最好的data locality。

　　如果使用secondary或者secondaryPreferred，那么需要意识到：

　　(1) 因为延时，读取到的数据可能不是最新的，而且不同的secondary返回的数据还可能不一样；

　　(2) 对于默认开启了balancer的sharded collection，由于还未结束或者异常终止的chunk迁移，secondary返回的可能是有缺失或者多余的数据

　　(3) 在有多个secondary节点的情况下，选择哪一个secondary节点呢，简单来说是“closest”即平均延时最小的节点，具体参加Server Selection Algorithm

read-concern:

　　read concern是在MongoDB3.2中才加入的新特性，表示对于replica set（包括sharded cluster中使用复制集的shard）返回什么样的数据。不同的存储引擎对read-concern的支持情况也是不一样的

　　read concern有以下三个level：

　　local：默认值，返回当前节点的最新数据，当前节点取决于read reference。

　　majority：返回的是已经被确认写入到多数节点的最新数据。该选项的使用需要以下条件： WiredTiger存储引擎，且使用election protocol version 1；启动MongoDB实例的时候指定 --enableMajorityReadConcern选项。

　　linearizable：3.4版本中引入，这里略过了，感兴趣的读者参考文档。

　　在文章中有这么一句话：

Regardless of the read concern level, the most recent data on a node may not reflect the most recent version of the data in the system.

　　就是说，即便使用了read concern：majority，返回的也不一定是最新的数据，这个和NWR理论并不是一回事。究其根本原因，在于最终返回的数值只来源于一个MongoDB节点，该节点的选择取决于read reference。

　　在这篇文章中，对readconcern的引入的意义以及实现有详细介绍，在这里只引用核心部分：

readConcern 的初衷在于解决『脏读』的问题，比如用户从 MongoDB 的 primary 上读取了某一条数据，但这条数据并没有同步到大多数节点，然后 primary 就故障了，重新恢复后这个primary 节点会将未同步到大多数节点的数据回滚掉，导致用户读到了『脏数据』。

当指定 readConcern 级别为 majority 时，能保证用户读到的数据『已经写入到大多数节点』，而这样的数据肯定不会发生回滚，避免了脏读的问题。

一致性 or 可用性？

　　回顾一下CAP理论中对一致性可用性的问题：
　　一致性，是指对于每一次读操作，要么都能够读到最新写入的数据，要么错误。
　　可用性，是指对于每一次请求，都能够得到一个及时的、非错的响应，但是不保证请求的结果是基于最新写入的数据。

　　前面也提到，本文对一致性可用性的讨论是基于replica set的，是否是shared cluster并不影响。另外，讨论是基于单个客户端的情况，如果是多个客户端，似乎是隔离性的问题，不属于CAP理论范畴。基于对write concern、read concern、read reference的理解，我们可以得出以下结论。

默认情况（w：1、readconcern：local）如果read preference为primary，那么是可以读到最新的数据，强一致性；但如果此时primary故障，那么这个时候会返回错误，可用性得不到保证
默认情况（w：1、readconcern：local）如果read preference为secondary（secondaryPreferred、primaryPreferred），虽然可能读到过时的数据，但能够立刻得到数据，可用性比较好
writeconern：majority保证写入的数据不会被回滚; readconcern：majority保证读到的一定是不会被回滚的数据
若（w：1、readconcern；majority）即使是从primary读取，也不能保证一定返回最新的数据，因此是弱一致性
若（w: majority、readcocern：majority），如果是从primary读取，那么一定能读到最新的数据，且这个数据一定不会被回滚，但此时写可用性就差一些；如果是从secondary读取，不能保证读到最新的数据，弱一致性。

　　回过来来看，MongoDB所说的高可用性是更普世意义上的可用性：通过数据的复制和自动failover，即使发生物理故障，整个集群还是能够在短时间内回复，继续工作，何况恢复也是自动的。在这个意义上，确实是高可用的。

references

【1】http://blog.nahurst.com/visual-guide-to-nosql-systems 【2】https://en.wikipedia.org/wiki/CAP_theorem 【3】Towards Robust Distributed Systems 【4】Brewer‘s conjecture and the feasibility of consistent, available, partition-tolerant web services 【5】http://www.julianbrowne.com/article/viewer/brewers-cap-theorem 【6】brewers-cap-theorem-on-distributed-systems/ 【7】cap-twelve-years-later-how-the-rules-have-changed 【8】better-explaining-cap-theorem 【9】通过一步步创建sharded cluster来认识MongoDB 【10】write-concern 【11】read-concern 【12】read-preference

CAP理论与MongoDB一致性、可用性的一些思考

标签：family basic bsp cap art 条件创建 default linear

CAP理论与MongoDB一致性、可用性的一些思考

MongoDB与CAP

write-concern：

read-reference:

read-concern:

一致性 or 可用性？

references

人气教程排行