(FAQ)EAS Cloud服务端server1经常宕机,其余实例运行正常

栏目:eas cloud知识作者:金蝶来源:金蝶云社区发布:2024-09-16浏览:1

(FAQ)EAS Cloud服务端server1经常宕机,其余实例运行正常

(FAQ)EAS Cloud服务端server1经常宕机,其余实例运行正常
原因分析: 1、单机1个节点3个EAS实例的EAS群集。反馈server1频繁停止,但是其他2个实例正常运行。因此判断server1实际没有停止,只是显示状态是停止。如果server1真正停止,其他实例将无法使用。 2、Windows2003,32C16G内存。server1的GC日志正常,说明不是因内存不足导致。 3、server1/bin下没有server.pid,进一步验证问题。控制台读取不到server.pid文件的进程号,因此显示停止。为何停止是已知问题(在群集启动的情况下,手工再启动实例下的startserver.bat会导致server.pid丢失) 4、server1/bin下有大量hs_err_pid*.log日志产生。大部分是HTTP线程,线程阻塞等。排查server1的apusic.log,发现有“OutOfMemoryError: unable to create new native thread”,说明server1因无法创建线程,线程过多导致OOM. 因此初步判断有几个原因导致server1异常。状态停止可能是因为再次启动server脚本,或线程阻塞导致。阻塞的原因需要排查二次开发代码和客户连接的端口是否是网络代理端口。 解决方法: 1、通过启动、停止群集正常使用,启动后不要再通过脚本启动各个实例的启动脚本。(已知问题,控制台模块开发继续后续分析) 2、知会客户客户端登陆都要使用群集的HTTP(网络代理)和RPC端口。 监控群集负载均衡是否正常,是否都负载到了server1?(netstat -an|find "6888",查看有多少个IP在连接server1),或者客户端使用的http端口都是server1的http端口,而不是网络代理的端口? 3、排查二次开发代码是否有连接泄露等。参考:http://service.kingdee.com/knowledge/view/47387.html。 4、客户管理员排查,是否有中毒等导致恶意连接太多。 关键字 Server1停止, OutOfMemoryError: unable to create new native thread, R110712-0428

(FAQ)EAS Cloud服务端server1经常宕机,其余实例运行正常

(FAQ)EAS Cloud服务端server1经常宕机,其余实例运行正常原因分析:1、单机1个节点3个EAS实例的EAS群集。反馈server1频繁停止,但是其他2...
点击下载文档
确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息