实例健康度差被重启

栏目:eas cloud知识作者:金蝶来源:金蝶云社区发布:2024-09-16浏览:1

实例健康度差被重启

适用版本 8.2问题描述客户端登录显示0天,经分析实例1被异常重启过,server.trace有auto kill的记录,如下图:

Ha.log对应时间点输出健康度差的日志,如下图:

但检查实例的gc日志正常,无内存溢出现象。


原因分析:
查看对应时间点的loadbalance日志,如附件
[2019-01-16 23:26:46,064 ERROR RPC-93]Who send Notification
java.lang.Exception: Who send Notification,url=tcp://192.168.1.49:11034,sequenceNumber=0,timesnap=1547652406064
健康度检查机制的线程是dynamicFactorRetriever开头的,从上面的RPC-93看出当前发送给控制台健康度差的线程并非是健康度检查机制的线程,而是客户端连接的线程。 因此是客户端连到群集控制器,控制器分发给某个实例时连不上,因此这个线程告诉控制台实例健康度差,将实例重启。经评估,偶尔一次连不上不一定就有问题。而且健康度差的报告应该统一由健康检查机制的线程去发送,不建议其它的线程干扰。
解决方案:
安装补丁PT132052,修复健康度检查机制,以健康度检查机制的线程的通知为标准即可。

实例健康度差被重启

适用版本: 8.2问题描述客户端登录显示0天,经分析实例1被异常重启过,server.trace有auto kill的记录,如下图:Ha.log...
点击下载文档
确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息