gPaaS6.0.2及以上版本自定义指标监控及预警配置说明

gPaaS监控服务采用云原生Prometheus监控方案,通过exporter对监控对象进行数据指标采集。当官方提供的各种采集exporter不满足指标采集和监控需求时,可以自己编写脚本采集指标,由Prometheus定期采集实现。
如下以单节点k8s 默认数据目录 /var的使用率为例进行说明,当该目录使用率大于85%时发送预警,以免苍穹pod和镜像被删除而影响业务。
(1).在安装器安装好的k8s主机上,创建如下目录:
# mkdir -p /usr/local/node_exporter
# mkdir -p /usr/local/node_exporter/script
# mkdir -p /usr/local/node_exporter/key
(2).修改默认的node_exporter启动脚本
# vi /usr/lib/systemd/system/node_exporter.service
内容如下(添加红框内容):
####################################
[Unit]
Description=Node Exporter
Wants=network-online.target
After=network-online.target
[Service]
User=root
ExecStart=/usr/bin/node_exporter --collector.textfile.directory=/usr/local/node_exporter/key --web.listen-address=:19100
[Install]
WantedBy=default.target
####################################
注:
1). collector.textfile.directory 是 Node Exporter 的一个命令行选项,用于指定从 textfile 收集器中收集数据的目录。
Node Exporter 会通过各种方式收集主机的度量值,并将这些度量值暴露给 Prometheus。其中之一是 textfile 收集器,它允许您从文本文件中收集指标。这些文本文件通常由其他程序生成,并以固定格式存储在指定的目录中。
使用 --collector.textfile.directory 选项,您可以告诉 Node Exporter 去哪个目录下查找这些文本文件。当 Node Exporter 拉取度量值时,它会扫描该目录下所有符合规则的文件,并将它们解析为度量样本,然后传递给 Prometheus Server。
2).收集的文本指标格式为 指标名称(建议设置为英文)+空格+指标值。指标值只能为数字, 可以包含多行,每行一个指标名和指标值。指标名和指标值在后续的指标可视化展示和报警设置中会用上。文本内容样例如下:
disk_usages 80
erp_access_status 1
(3).保存上述文件后,执行如下命令使配置生效
#systemctl daemon-reload && systemctl enable node_exporter && systemctl restart node_exporter
(4).编写采集脚本
(注:可以根据需要,使用采集脚本采集其他数据进行监控和预警。比如拨测场景中,通过脚本检测网站是否可用,不可用则返回0,可以返回1)
# vi /usr/local/node_exporter/script/check_var_usage.sh
脚本内容如下:
####################################
#!/bin/bash
# 设置目录路径
directory="/var"
# 检查目录是否存在
if [ ! -d "$direct
gPaaS6.0.2及以上版本自定义指标监控及预警配置说明
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。



