关于Mesos /slaves endpoint处理slave节点的active status的疑问。


Mesos集群中,如果某个已经register成功并且状态为actived 的 slave节点由于网络partition或者mesos-slave进程down掉等原因,导致其状态变为Deactivated,到一定时间后,mesos-slave进程自动关闭。
这个时候,你会在Mesos Web Consule中看到对应的slave节点状态Deactivated,如下图所示:

mesos-deactivated.pic_.jpg


然后我手动到该slave节点去启动mesos-slave进程,该slave就能成功re-register,状态更新为activated。
但是在Mesos Web Consule或者通过/slaves endpoint获取数据,都发现出现两条这个slave节点,其中一个状态为Deactivated,一个为activated,如下图所示:

mesos-2.pic_hd_.jpg


我的问题是:为什么Mesos的/slaves endpoint返回的信息中,会出现同一个节点不同状态都在列表中的现象?不应该只保留节点最新状态数据吗?
已邀请:

徐磊 - BlackOps@Qunar

赞同来自: jxcdwangtao


我也遇到过这个情况,Mesos 0.25发现的,已经去dev-list发了邮件咨询,还未有回复。

xds2000 - 数人科技CTO

赞同来自:


master config 有一个配置slave_reregister_timeout看一下:
The timeout within which all slaves are expected to re-register when a new master is elected as the leader. Slaves that do not re-register within the timeout will be removed from the registry and will be shut down if they attempt to communicate with master. NOTE: This value has to be at least 10mins. (default: 10mins) ex. --slave_reregister_timeout=5mins

默认是10分钟,你可以配置少一点时间看看。

要回复问题请先登录注册