请教一个关于Marathon 的问题


我看到Marathon在创建app的时候,有这三个参数,"backoffSeconds": 1, "backoffFactor": 1.15,
"maxLaunchDelaySeconds": 3600,
个人理解是设置最大重试时间,但是结果并不是这样,请问marathon有 app 创建的时候最大重试次数或者重试时间这样的参数吗? 就是当一个 app container本来就是错误的,现在 marathon 会反复重启他,有没有参数限制重启次数或者最大尝试时间之类?多谢
已邀请:

wdxxs2z

赞同来自:


添加healthcheck maxConsecutiveFailures 一般为3次 官方文档很详细。

xianlubird - Rookie at IBM

赞同来自:


但是这个失败之后,task 会被 kill,marathon 会重新开启一个新的 task,再次尝试启动,我希望尝试三次之后,不再启动,有参数吗

jxcdwangtao

赞同来自:


你的这个想法和marathon的 long running 理念不匹配啊。
你应该通过metrics/snapshot发现某个task一直在不断重启后,就要把这个app/task干掉才对。

jxcdwangtao

赞同来自:


查了一下官方文档,重新理解了一下这三个参数的意义:"backoffSeconds", "backoffFactor", "maxLaunchDelaySeconds"。
这三个参数是能满足你的需求的,只不过sample中这三个值的设置不合理。
"backoffSeconds": 1, "backoffFactor": 1.15,
"maxLaunchDelaySeconds": 3600 这意味着在被真正不重启之前,你要重启58次,累积时间为:
1s + 1.15s + 1.32s + .... + 3314s,约7个小时。

就是说,你这种app的配置,失败后大学需要7个小时才不会被重启了,真正被kill掉了。

要回复问题请先登录注册