Ceph心跳机制的示例分析

发布时间:2021-12-17 10:45:01 作者:小新
来源:亿速云 阅读:165

这篇文章将为大家详细讲解有关Ceph心跳机制的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

1. 心跳介绍

心跳是用于节点间检测对方是否故障的,以便及时发现故障节点进入相应的故障处理流程。

问题:

故障检测策略应该能够做到:

2. Ceph 心跳检测

Ceph心跳机制的示例分析

ceph_heartbeat_mon.png

OSD报告给Monitor:

5. Ceph心跳检测总结

Ceph通过伙伴OSD汇报失效节点和Monitor统计来自OSD的心跳两种方式判定OSD节点失效。

6. 心跳设置

6.1 配置监视器/ OSD互动

您已完成初始Ceph的配置之后,您可以部署和运行的Ceph。当你执行一个命令,如ceph health 或 ceph -s , Ceph的监视器将报告 CEPH存储集群的当前状态。Ceph的监视器通过每个 Ceph的OSD守护实例,以及相邻的Ceph OSD守护实例,了解Ceph的存储集群的相关状态。Ceph的监视器如果没有收到报告,或者如果它接收Ceph的存储集群的变化的报告,Ceph的监视器更新的的 CEPH集群映射图的状态。

Ceph为Ceph的监视器/ Ceph的OSD守护程序交互提供合理的默认设置。但是,您可以覆盖默认值。以下部分描述如何用Ceph的监视器和Ceph的OSD守护实例互动来达到Ceph的存储集群监控的目的。

6.2. OSDS检查心跳

每个Ceph的OSD守护程序检查其他Ceph的OSD守护进程的心跳每6秒。Ceph的配置文件下的[OSD]部分加入OSD   osd heartbeat interval ,或通过设定值在运行时,您可以更改心跳间隔。如果在20秒的宽限期内邻居的Ceph的OSD守护进程不显示心跳,Ceph的OSD守护进程可能考虑周边的Ceph OSD守护挂掉,并向一个Ceph的Monitor报告,这将更新的CEPH集群地图。一个OSD   osd heartbeat grace 可以在Ceph的配置文件下的[OSD]部分设置,或在运行时,你通过设置这个值改变这个宽限期。

6.3. OSDS报告挂掉的OSD

默认情况下,Ceph的OSD守护程序必须向Ceph的监视器报告三次:另一个Ceph的OSD守护程序已经挂掉,在Ceph的Monitor承认该报告Ceph的OSD守护挂掉之前。在(早期V0.62版本之前)Ceph的配置文件下的[MON]部分添加  osd min down reports setting,或者通过设定值在运行时,您可以更改OSD报告的挂掉的最低数量 。默认情况下,只有一个Ceph的OSD守护进程是必需报告另一个Ceph的OSD守护进程。您可以更改向Ceph监视器报告Ceph的OSD守护进程的Ceph的OSD Daemones 的数量,通过添加一个mon osd min down reporters设置在Ceph的配置文件中,或者通过设定值在运行时。

6.4. 凝视失败的OSD报告

Ceph的OSD守护进程如果不能和Ceph的配置文件(或群集地图)中定义的OSD守护同行,它将每30秒ping一个Ceph的监视器,为了最新副本的集群映射图。Ceph的配置文件 下的[OSD]部分加入  osd mon heartbeat interval  设置,或通过在运行时设定值,您可以更改Ceph的监控心跳间隔。

6.5. OSDS报告其状态

Ceph的OSD守护进程如果不向Ceph的监视器报告,至少每120秒一次,Ceph的监视器会考虑Ceph的OSD守护已经挂掉。您可以更改Ceph的监控报告间隔,通过加入 osd mon report interval max 设置在Ceph的配置文件的[OSD]部分,或者通过设置在运行时的值。Ceph的OSD守护进程会尝试报告其状态每30秒。在Ceph的配置文件下的[OSD]部分加入 osd mon report interval min s设置,或者通过设定值在运行时,您可以更改Ceph的OSD守护报告间隔。

7. 配置设置

修改心跳设置时,你应该将它们包括在 您的配置文件的[global]部分。

7.1 监视器MONITOR设置

参数说明类型默认值
mon OSD min up ratioCeph的OSD未挂掉的最低比率在Ceph的OSD守护程序被仍定挂掉之前double0.3
mon OSD min in ratioCeph的OSD实例的最低比率在Ceph的OSD守护程序被仍定出局之前double0.3
mon osd laggy halflifelaggy估计会腐烂的秒数int60 * 60
mon osd laggy weightlaggy估计衰减的新样本的权重double0.3
mon osd adjust heartbeat grace如果设置为true,Ceph将在laggy估计的基础上扩展booltrue
mon osd adjust down out interval如果设置为true,Ceph基于laggy估计扩展booltrue
mon osd auto mark inCeph将标记任何引导的Ceph的OSD守护进程作为在 CEPH存储集群boolfalse
mon osd auto mark auto out inCeph的标记引导Ceph的OSD守护 Ceph的存储集群,集群中的自动标记booltrue
mon osd auto mark new in头孢将迎来启动新的Ceph的OSD守护在 Ceph的存储集群booltrue
mon osd down out subtree limit最大的 CRUSH单位Ceph的类型,会自动标记出来Stringrack
mon osd report timeout宽限期秒下来在声明反应迟钝Ceph的OSD守护前32-bit Integer900
mon osd min down reportersCeph的OSD守护报告向下 Ceph的OSD守护所需的最低数量32-bit Integer1
mon osd min down reportsCeph的OSD守护的最低次数必须报告说,另一个Ceph的OSD守护下来32-bit Integer3

7.2 OSD设置

参数说明类型默认值
OSD heartbeat address一个Ceph的OSD守护进程的网络地址的心跳AddressThe host address
OSD heartbeat interval多久Ceph的OSD守护坪及其同行(以秒计)32-bit Integer6
OSD heartbeat graceCeph的OSD当一个守护进程并没有表现出心跳Ceph的存储集群认为,经过时间的32-bit Integer20
OSD mon heartbeat intervalCeph的的OSD守护坪一个Ceph的监视器如果它没有的CEPH OSD守护同行,多久32-bit Integer30
OSD mon report interval maxCeph的OSD守护进程报告Ceph的监视器Ceph的监视器前认为Ceph的OSD守护下来的时间以秒为单位的最大32-bit Integer120
OSD mon report inteval min秒为Ceph的OSD的守护Ceph的监视器,以防止Ceph的监视器考虑Ceph的OSD守护的最低数量32-bit Integer5 (有效范围:应小于OSD 周一 报告 间隔 最大)
OSD mon ACK timeout等待的秒数为Ceph的监视器确认请求统计32-bit Integer

关于“Ceph心跳机制的示例分析”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

推荐阅读:
  1. 小程序websocket心跳库的示例分析
  2. SpringBoot如何整合Netty心跳机制

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

ceph

上一篇:如何构建基于Ceph对象存储

下一篇:python匿名函数怎么创建

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》