中间件管理服务FAQ

栏目:云苍穹知识作者:金蝶来源:金蝶云社区发布:2024-09-23浏览:1

中间件管理服务FAQ

**一、无法触发定时备份** **现象:** 依据操作手册配置定时备份后,依然无法触发备份 **解决方案:** 1.定时功能主要是依赖于k8s内的kme-operator来触发,所以进入k8s所在机器执行 : ``` kubectl get pod -n kme-system ``` ![image.webp](/download/0100c637d5e7cf294224bfa253a075057a23.webp) 查看是否存在kme-operator-controller为前缀的pod,命名空间默认是kme-system,并且STATUS是否是Running. 2.定时备份在k8s中的crd是middlewarebackupschedules.kme.kdcloud.io,所以也要查看是否有这个crd. ``` kubectl get crd | grep middlewarebackupschedules.kme.kdcloud.io ``` ![image.webp](/download/0100d90bc1d0efb34610a35e573b443c05cd.webp) 3.需要依赖两个镜像 ``` kcr.kingdee.com/gpaas/kme/curl kcr.kingdee.com/gpaas/kme/kme-operator ``` 通过docker images 查看是否有这两个镜像. ![image.webp](/download/01002f853c9d56d94ce5a59a31b84d8fdf4e.webp) **二、安装平台备份工具后,实例起不来** **现象:** postgresql全量备份配置执行 `curl -sfL [https://p.cloudsz.kingdee.com/kce/kme/backup-dependency/pg.sh](https://p.cloudsz.kingdee.com/kce/kme/backup-dependency/pg.sh) | bash -` 命令后postgresql实例挂掉, `systemctl status postgresql` 中报错提示Segment_size 初始化和编译的值不同 **原因:** 使用旧版安装器(5.0.3及以前版本)安装的postgresql,与新版本的segment_size冲突 **解决办法:** 1. 下载旧版本的 `pg12.8-kme.tar.gz` 到机器上,重新覆盖安装备份相关依赖文件: - 确保 `/var/postgresql/soft/` 路径存在,若不存在则执行 `mkdir -p /var/postgresql/soft/ && tar -zxvf pg12.8-kme.tar.gz -C /var/postgresql/soft/` 创建该路径并将旧的 `pg12.8-kme.tar.gz` 包解压到该路径下 2. 配置环境变量: - 检查是否有 `postgres` 用户及权限,没有对应用户需要执行 `useradd -m postgres` 新建 `postgres` 用户并给予权限: - 登录到 `postgres` 用户 `cat /home/postgres/.bashrc` 查看用户环境变量是否有 `export LD_LIBRARY_PATH=/var/postgresql/soft/pg12.8/lib` ,没有的话需要手动使用 `vim` 或 `vi` 方式编辑 `/home/postgres/.bashrc` 将环境变量加入进去 - 执行 `source ~/.bashrc` 使环境变量生效 3. 重启postgresql **三、实例与主机显示连接失败** **现象:**中间件实例与主机显示连接异常 ![image.webp](/download/0100acdfa59b119342adb2f1443d0c16685a.webp) **解决办法:** 按下列步骤操作,若步骤1没解决问题,则尝试步骤2,以此类推 1.点击页面【重新连接】功能,尝试重连 2.请检查数据库机器、与备份节点上上9990端口是否打开且可访问 3.检查gpaas所在机器上30088端口是否打开且可访问 4.选择 gpaas容器服务 ->服务访问 ---> 外部访问查看kme-web-nodeport配置,配置缺失手动添加,如下图: ![image.webp](/download/010012145fe1e06a471093643c7fc029d7e2.webp) 以此类推 **四、老版本pg定时备份不生效——缺少镜像** **现象:** 由于缺少关键镜像,PostgreSQL定时备份功能无法正常生效。 ![image.webp](/download/0100a991bf6eb3f84a2390f6788674effae4.webp) **解决办法:** 检查Pod拉取镜像状态: 首先,检查 kme-externalpg-10000 命名空间下的定时任务Pod是否存在拉取镜像失败的问题: 查看Pod日志以识别问题镜像: 使用以下命令查看特定Pod的日志,以确定是哪个镜像无法拉取: kubectl logs <pod-name> -n <namespace> 清理问题Pod: 执行以下步骤清理因镜像拉取失败而处于异常状态的Pod: 1.使用以下命令列出所有因镜像拉取失败而处于 Failed 状态的Pod: ``` kubectl get pods -n <namespace> --field-selector=status.phase=Failed,status.reason=ImagePullBackoff ``` 2.然后,使用以下命令删除这些Pod: ``` kubectl delete pods -n <namespace> --field-selector=status.phase=Failed,status.reason=ImagePullBackoff ``` 3.上传并加载镜像: 将缺失的镜像上传到gpaas机器,并使用以下命令加载镜像: ``` docker load -i <image> ``` 4.验证定时任务恢复情况: 加载镜像后,检查pg定时备份任务是否已恢复正常执行。

中间件管理服务FAQ

**一、无法触发定时备份****现象:** 依据操作手册配置定时备份后,依然无法触发备份**解决方案:**1.定时功能主要是依赖于k8s内的kme-ope...
点击下载文档
确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息