中间件管理服务FAQ
**一、无法触发定时备份**
**现象:** 依据操作手册配置定时备份后,依然无法触发备份
**解决方案:**
1.定时功能主要是依赖于k8s内的kme-operator来触发,所以进入k8s所在机器执行 :
```
kubectl get pod -n kme-system
```
![image.webp](/download/0100c637d5e7cf294224bfa253a075057a23.webp)
查看是否存在kme-operator-controller为前缀的pod,命名空间默认是kme-system,并且STATUS是否是Running.
2.定时备份在k8s中的crd是middlewarebackupschedules.kme.kdcloud.io,所以也要查看是否有这个crd.
```
kubectl get crd | grep middlewarebackupschedules.kme.kdcloud.io
```
![image.webp](/download/0100d90bc1d0efb34610a35e573b443c05cd.webp)
3.需要依赖两个镜像
```
kcr.kingdee.com/gpaas/kme/curl
kcr.kingdee.com/gpaas/kme/kme-operator
```
通过docker images 查看是否有这两个镜像.
![image.webp](/download/01002f853c9d56d94ce5a59a31b84d8fdf4e.webp)
**二、安装平台备份工具后,实例起不来**
**现象:** postgresql全量备份配置执行 `curl -sfL [https://p.cloudsz.kingdee.com/kce/kme/backup-dependency/pg.sh](https://p.cloudsz.kingdee.com/kce/kme/backup-dependency/pg.sh) | bash -` 命令后postgresql实例挂掉, `systemctl status postgresql` 中报错提示Segment_size 初始化和编译的值不同
**原因:** 使用旧版安装器(5.0.3及以前版本)安装的postgresql,与新版本的segment_size冲突
**解决办法:**
1. 下载旧版本的 `pg12.8-kme.tar.gz` 到机器上,重新覆盖安装备份相关依赖文件:
- 确保 `/var/postgresql/soft/` 路径存在,若不存在则执行 `mkdir -p /var/postgresql/soft/ && tar -zxvf pg12.8-kme.tar.gz -C /var/postgresql/soft/` 创建该路径并将旧的 `pg12.8-kme.tar.gz` 包解压到该路径下
2. 配置环境变量:
- 检查是否有 `postgres` 用户及权限,没有对应用户需要执行 `useradd -m postgres` 新建 `postgres` 用户并给予权限:
- 登录到 `postgres` 用户 `cat /home/postgres/.bashrc` 查看用户环境变量是否有 `export LD_LIBRARY_PATH=/var/postgresql/soft/pg12.8/lib` ,没有的话需要手动使用 `vim` 或 `vi` 方式编辑 `/home/postgres/.bashrc` 将环境变量加入进去
- 执行 `source ~/.bashrc` 使环境变量生效
3. 重启postgresql
**三、实例与主机显示连接失败**
**现象:**中间件实例与主机显示连接异常
![image.webp](/download/0100acdfa59b119342adb2f1443d0c16685a.webp)
**解决办法:**
按下列步骤操作,若步骤1没解决问题,则尝试步骤2,以此类推
1.点击页面【重新连接】功能,尝试重连
2.请检查数据库机器、与备份节点上上9990端口是否打开且可访问
3.检查gpaas所在机器上30088端口是否打开且可访问
4.选择 gpaas容器服务 ->服务访问 ---> 外部访问查看kme-web-nodeport配置,配置缺失手动添加,如下图:
![image.webp](/download/010012145fe1e06a471093643c7fc029d7e2.webp)
以此类推
**四、老版本pg定时备份不生效——缺少镜像**
**现象:** 由于缺少关键镜像,PostgreSQL定时备份功能无法正常生效。
![image.webp](/download/0100a991bf6eb3f84a2390f6788674effae4.webp)
**解决办法:**
检查Pod拉取镜像状态:
首先,检查
kme-externalpg-10000 命名空间下的定时任务Pod是否存在拉取镜像失败的问题:
查看Pod日志以识别问题镜像:
使用以下命令查看特定Pod的日志,以确定是哪个镜像无法拉取:
kubectl logs <pod-name> -n <namespace>
清理问题Pod:
执行以下步骤清理因镜像拉取失败而处于异常状态的Pod:
1.使用以下命令列出所有因镜像拉取失败而处于 Failed 状态的Pod:
```
kubectl get pods -n <namespace> --field-selector=status.phase=Failed,status.reason=ImagePullBackoff
```
2.然后,使用以下命令删除这些Pod:
```
kubectl delete pods -n <namespace> --field-selector=status.phase=Failed,status.reason=ImagePullBackoff
```
3.上传并加载镜像:
将缺失的镜像上传到gpaas机器,并使用以下命令加载镜像:
```
docker load -i <image>
```
4.验证定时任务恢复情况:
加载镜像后,检查pg定时备份任务是否已恢复正常执行。
中间件管理服务FAQ
**一、无法触发定时备份****现象:** 依据操作手册配置定时备份后,依然无法触发备份**解决方案:**1.定时功能主要是依赖于k8s内的kme-ope...
点击下载文档
上一篇:gPaaS运维其他常见问题下一篇:中间件管理-PG备份报错FAQ
本文2024-09-23 01:09:53发表“云苍穹知识”栏目。
本文链接:https://wenku.my7c.com/article/kingdee-cangqiong-144179.html
您需要登录后才可以发表评论, 登录登录 或者 注册
最新文档
热门文章