
文章插图
如果仍无法确认原因,联系华为工程师 。
etcd进程故障导致ETCD服务异常告警问题现象etcd进程down、重启,管控面上报etcd服务异常告警
问题分析及界定登陆故障etcd节点,进入Ruby用户,执行命令ps ux | grep etcd,查看etcd进程是否在运行 。
如果进程在,查看etcd进程启动时间,告警时是否重启过,联系华为工程师确认重启原因 。

文章插图
如果进程不在,查看etcd无法启动原因:
(1)cd $GAUSSLOG/bin, 查看目录下是否有cluster_manual_start 和 etcd_manual_start 两个文件,
如果有表示集群被停止,确认停止集群的原因,之后启动集群,定位结束 。
(2)cd $GAUSSHOME/bin 查看目录下是否存在etcd这个文件,文件权限是否正确,确认文件不存在或权限不正确的原因 。
(3)检查etcd的数据目录所在磁盘是否满了或者故障,etcd目录如下:cm_ctl query -Cvipd查看

文章插图
检查etcd的数据目录所在磁盘是否满了或者目录权限不正确(正确是700)或者故障,
如果磁盘满,检查占用磁盘的文件并清除或者转存到其他盘,如果是etcd本身的文件占满,联系华为工程师分析原因 。
如果目录权限不正确,修改为正确的目录权限 。如果是磁盘故障 , 联系IaaS技术支持分析定位 。
处理步骤参照上述处理 , 如果不是以上原因,请联系华为工程师
OM接口无法正确返回结果导致ETCD服务异常告警问题现象管控面上报etcd服务异常告警,管控无法获取集群状态
问题分析及界定查看管控面是否获取集群状态成功,是否获取空消息,联系华为工程师分析定位 。
cd $GAUSSLOG/om/
查看gs_om-xxx.log , 是否有如下异常日志
例如: The status file does not exist. Path: /usr/local/temp/local_status_1611355718.58.dat.
处理步骤参照上面描述步骤 。
点击关注,第一时间了解华为云新鲜技术~
【实例解读丨关于GaussDB ETCD服务异常】
推荐阅读
- 手把手教你使用LabVIEW实现Mask R-CNN图像实例分割
- 【pytest官方文档】解读-开发可pip安装的第三方插件
- 跟我学Python图像处理丨图像特效处理:毛玻璃、浮雕和油漆特效
- GLA 论文解读《Label-invariant Augmentation for Semi-Supervised Graph Classification》
- ULID规范解读与实现原理
- Python地图栅格化实例
- 钩子 【pytest官方文档】解读-插件开发之hooks 函数
- 实例分析Scheduled Thread Pool Executor与Timer的区别
- 带你读AI论文丨ACGAN-动漫头像生成
- spring boot项目使用mybatis-plus代码生成实例