关于复制,你了解了多少(附副本集常见任务教程)

关于复制,你了解了多少(附副本集常见任务教程)MongoDB Manual (Version 4.2)> Replication MongoDB中的副本集是一组维护相同数据集合的 mongod进程。副本集提供了冗余和高可用性,并且这是所有生产部…

关于复制,你了解了多少(附副本集常见任务教程)

MongoDB Manual (Version 4.2)> Replication

MongoDB中的副本集是一组维护相同数据集合的 mongod进程。副本集提供了冗余和高可用性,并且这是所有生产部署的基础。本节介绍MongoDB中的复制以及副本集的组件和体系结构,并提供副本集常见任务的教程。

 

No冗余和数据

复制提供了冗余并增加了数据可用性。对于不同数据库服务器上的多个数据副本,复制为防止单台数据库服务器故障提供了一定程度的容错能力。

在某些情况下,复制可以提高读取性能,因为客户端可以将读操作发送到不同的服务器上。在不同的数据中心维护数据副本可以提高分布式应用程序的数据本地化和可用性。您还可以维护额外的副本以实现特殊用途,比如灾难恢复、报告或备份。

 

No2 MongoDB的复制

副本集是一组维护相同数据集合的 mongod实例。副本集包含多个数据承载节点和一个可选的仲裁节点。在数据承载节点中,有且仅有一个成员为主节点,其他节点为副本节点。

主节点 接收所有的写操作。一个副本集仅有一个主节点能够用{ w: "majority" } 写关注点级别来确认写操作;虽然在某些情况下,另一个mongod的实例也可以暂时认为自己是主节点。[1] 主节点会将其数据集合所有的变化记录到操作日志中,即oplog。有关主节点操作的更多信息,请参见 副本集主节点。

关于复制,你了解了多少(附副本集常见任务教程)

 

副本节点复制主节点的oplog,并将这些操作应用于它们的数据集,这样以便副本节点的数据集能反映出主节点的数据集。如果主节点不可用,一个候选的副本节点将会发起选举并使之成为新的主节点。有关副本成员的更多信息,请参见副本集副本成员。

关于复制,你了解了多少(附副本集常见任务教程)

 

在某些情况下(比如您有一个主节点和一个副本节点,但由于成本约束无法添加另一个副本节点),您可以选择将一个 mongod 实例作为仲裁节点添加到一个副本集中。仲裁节点参与选举但不持有数据(即不提供数据冗余)。有关仲裁节点的更多信息,请参见副本集仲裁节点。

关于复制,你了解了多少(附副本集常见任务教程)

 

仲裁节点永远只能是仲裁节点,但在选举过程中主节点也许会降级成为副本节点, 副本节点也可能会升级成为主节点。

 

No3 异步复制

副本节点复制主节点的oplog并异步地应用操作到它们的数据集。通过让副本节点的数据集反映主服务器的数据集,副本集可以在一个或多个成员失败的情况下继续运行。

有关复制机制的更多信息,请参见副本集Oplog和副本集数据同步。

 

慢操作

从4.2版本开始(从4.0.6开始也是可行的),副本集的副本成员会记录oplog中应用时间超过慢操作阈值的慢操作条目。这些慢oplog信息被记录在副本节点的诊断日志中,其路径位于REPL 组件的文本applied op: took ms中。这些慢日志条目仅仅依赖于慢操作阈值。它们不依赖于日志级别(无论是系统还是组件级别)、过滤级别,或者慢操作采样比例。过滤器不会捕获慢日志条目。

 

复制延迟和流控制

复制延迟 指的是将主节点的写操作拷贝(即复制)到副本节点所花费的时间。一些小的延迟期可能是可以接受的,但是随着复制延迟的增长,会出现严重的问题,包括引起主节点的缓存压力。

从MongoDB 4.2开始,管理员可以限制主节点应用写操作的速度,目的是将majority committed 延迟保持在可配置参数flowControlTargetLagSeconds的最大值之下。

默认情况下,流控制是启用的。

 

注意:

为了进行流控制,复制集/分片集群必须满足:参数featureCompatibilityVersion (FCV) 设置为4.2并启用majority读关注点。也就是说,如果FCV不是 4.2 ,或者读关注点majority被禁用,那么启用流控制将不起作用。

启用流控制后,当延迟快接近flowControlTargetLagSeconds参数指定的秒数时,主节点上的写操作必须首先获得许可单(tickets)才可以获取写锁。通过限制每秒发出的许可单的数量,流控制机制可以将延迟保持在目标数值之下。

为获取更多信息,请参见检查复制延迟和流控制。

 

No4 自动故障转移

当主节点无法和集群中其他节点通信的时间超过参数electionTimeoutMillis配置的期限时(默认10s),一个候选的副本节点会发起选举来推荐自己成为新主节点。集群会尝试完成一次新主节点的选举并恢复正常的操作。

关于复制,你了解了多少(附副本集常见任务教程)

副本集在选举成功前是无法处理写操作的。如果读请求被配置运行在副本节点上,则当主节点下线时,副本集可以继续处理这些请求。

假设采用默认的副本配置选项,集群选择新主节点的中间过渡时间通常不应超过12秒。这包括了将主节点标记为unavailable、发起以及完成一次选举的时间。您可以通过修改settings.electionTimeoutMillis 复制配置选项来调整这个时间期限。网络延迟等因素可能会延长完成副本集选举所需的时间,从而影响您的集群在没有主节点的情况下运行的时间。这些因素取决于您实际的集群架构情况。

electionTimeoutMillis复制配置选项从默认的10000(10秒)降低可以更快地检测主节点故障。然而,由于诸如临时性的网络延迟等因素,集群可能会更频繁地发起选举,即使主节点在其他方面是健康的。这也许会增加w : 1 级别写操作发生回滚的可能性。

您的应用程序连接逻辑应该包括对自动故障转移和后续选举的容错处理能力。从MongoDB 3.6开始,MongoDB驱动程序可以探测到主节点的丢失,并自动重试某些写操作 一次,提供额外的自动故障转移和选举的内置处理:

  • MongoDB 4.2兼容的驱动程序默认启用可重试写
  • MongoDB 4.0和3.6兼容的驱动程序必须通过在 连接字符串中包含retryWrites=true来显式地启用可重试写。

请参见 副本集选举来获取副本集选举的完整信息。

为了解更多关于MongoDB失败处理的信息,请参见:

  • 副本集选举
  • 可重试写
  • 副本集故障期间的回滚

 

No5 读操作

读偏好 

 

默认情况下,客户端从主节点读取[1];然而,客户端可以定义一个读偏好 将读操作发送给副本节点。

关于复制,你了解了多少(附副本集常见任务教程)

异步复制至副本节点,意味着从副本节点读取返回的数据不能反映主节点上数据的状态。

包含读操作的多文档事务必须使用读偏好primary。在给定的事务中所有操作都必须路由至相同的成员节点。

为了解更多关于副本集读的信息,请参见读偏好。

 

数据可见性 

 

根据读关注点,客户端可以在写持久化前看到写结果:

  • 不管写的write concern级别是什么,其他使用了读关注点级别为 "local" 或 "available" 的客户端,可以在发起写操作的客户端确认其写成功之前查看该客户端写的结果。
  • 使用了读关注点级别为 "local" 或 "available" 的客户端,能读取在副本集故障转移期间可能随后被回滚掉的数据。

对于多文档事务中的操作,当事务提交时,在事务中所做的所有数据更改都会被保存并在事务外部可见。也就是说,事务在回滚其他更改时不会提交某些更改。

在事务提交之前,事务中所做的数据更改在事务外部是不可见的。

然而,当一个事务写入多个分片时,并不是所有外部的读操作都需要等待提交的事务的结果在分片中可见。例如,如果提交了一个事务,并且在分片a上可以看到写1,但是在分片B上还不能看到写2,那么外部读关注点为 "local" 的读可以在不看到写2的情况下读取写1的结果。

更多请参见Read Isolation, Consistency, and Recency。

 

No6 事务

 

从MongoDB 4.0开始,副本集支持多文档事务。

包含读操作的多文档事务必须使用读偏好 primary。给定事务中所有的操作都必须路由至相同的成员节点。

在事务提交之前,事务中所做的数据更改在事务外部是不可见的。

然而,当一个事务写入多个分片时,并不是所有外部的读操作都需要等待提交的事务的结果在分片中可见。例如,如果提交了一个事务,并且在分片a上可以看到写1,但是在分片B上还不能看到写2,那么外部读关注点为 "local" 的读可以在不看到写2的情况下读取写1的结果。

 

No6 变更流

从MongoDB 3.6开始,副本集和分片集群支持变更流。变更流允许应用程序访问实时数据更改,而不需要跟踪oplog的复杂性和风险。应用程序可以使用变更流来订阅一个或多个集合上的所有数据更改。

 

No附加功能

副本集提供了许多选项来支持应用程序的需求。例如,你可以使用多数据中心中的成员来部署一个副本集,或者通过调整一些成员的members[n].priority 来控制选举结果。副本集还支持用于报告、灾难恢复或备份功能的专用成员。

更多有关信息请参见优先级0的副本集成员,隐藏副本集成员和延迟副本集成员 。

注意:

(1, 2) 在 某些场景下, 一个复制集中的两个节点可能会认为它们是主节点,但最多,他们中的一个将能够完成写关注点为{ w: “majority” }写操作。可以完成 { w: “majority” } 写的节点是当前主节点,而另一个节点是原先的主节点,通常是由于网络分区导致它还没有意识到自己的降级。当这种情况发生时,连接到原先主节点的客户端尽管已经请求了读偏好primary,但可能还会观察到过时的数据,并且对原先主节点新写的操作最终将回滚掉。

 

译者:李正洋

MongoDB中文社区翻译小组成员

目前在传统金融行业从事DBA职务,5年+工作经验,主要负责公司oracle/mongodb/es/redis各类数据库及数据中心监控平台运维工作,oracle ocp,MongoDB认证专家,RHCE,现阶段对开源分布式数据库、云计算等领域有很大兴趣;平时喜欢打羽毛球、看电影等。

原文链接:

https://docs.mongodb.com/manual/replication/

了解近期社区更多动态?点击芒果Xin动态跳转了解——

关于复制,你了解了多少(附副本集常见任务教程)

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/8555.html

(0)
上一篇 2023-02-26 13:30
下一篇 2023-02-26

相关推荐

  • SQLSERVER预读逻辑读物理读[通俗易懂]

    SQLSERVER预读逻辑读物理读[通俗易懂]预读:用估计信息,去硬盘读取数据到缓存。预读100次,也就是估计将要从硬盘中读取了100页数据到缓存。 物理读:查询计划生成好以后,如果缓存缺少所需要的数据,让缓存再次去读硬盘。物理读10页,从硬盘中

    2022-12-22
    153
  • MySQL主从半同步复制「建议收藏」

    MySQL主从半同步复制「建议收藏」 一、半同步复制 1.半同步复制概念 从MYSQL5.5开始,支持半自动复制。之前版本的MySQL Replication都是异步(asynchronous)的,主库在执行完一些事务后, 是不…

    2023-03-27
    140
  • Oracle(PLSQL)入门学习八(完结篇)

    Oracle(PLSQL)入门学习八(完结篇)学习视频:https://www.bilibili.com/video/BV1tJ411r7EC?p=75 游标cursor:用于存放多条数据的容器。需要开始open和关闭close。游标下移使用“f

    2023-02-25
    157
  • Python计算π/4的正切值

    Python计算π/4的正切值在计算机科学中,计算圆周率是一个经典的问题。本文将介绍使用Python计算π/4的正切值的方法。

    2024-02-13
    92
  • 使用Matlab调用Python

    使用Matlab调用PythonMatlab和Python都是目前科学计算领域广泛使用的工具,两者各有特点,但有时需要在项目中混合使用两种语言。本文就是要介绍在使用Matlab的时候如何调用Python的技巧。Matlab作为高效的数值计算软件,它的许多内置函数在数值分析、优化、统计分析等领域都拥有广泛的应用。Python是一种易于上手的语言,具有强大的功能库和灵活的可扩展性。尤其是在数据处理、自然语言处理、图像处理等领域,Python已经成为非常流行的工具之一。在实际应用中,我们常常需要用Python对某些工作进行处理,然后利用Matlab对其作进一步的分析。

    2024-04-20
    68
  • sql漏洞注入工具_cve20201938漏洞

    sql漏洞注入工具_cve20201938漏洞
    CVE-2020-9402 Django GIS SQL注入漏洞 0x01.环境搭建 利用vulhub搭建漏洞环境 service docker start…

    2023-04-09
    168
  • 特征工程 降维_数据降维与特征选择异同

    特征工程 降维_数据降维与特征选择异同在业界广泛流传着一句话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。
    由此可见,数据和特征是多么的重要,而在数据大多数场景下,数据已经就绪,不同人对于同样的数据处理得到的特征却千

    2023-02-06
    140
  • 使用Python的TextBlob进行自然语言处理

    使用Python的TextBlob进行自然语言处理自然语言处理是一项涉及人工智能和语言学的研究领域,其目标是开发出能够理解和使用人类语言的计算机程序。使用Python的TextBlob进行自然语言处理是一种快速、方便和高效的方法,它提供了许多功能,包括分词、词性标注、命名实体识别和情感分析等。在本文中,我们将介绍TextBlob的基本知识和如何使用它进行自然语言处理。

    2024-05-08
    75

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注