本文章从用户实际使用场景角度,对gPaaS监控服务的整体配置流程进行说明。
一、监控指标配置
可根据需要配置对应指标的监控。主要分为如下3大类指标,建议都配置上。
1. 数据库、中间件及对应主机的指标监控配置
在仪表盘页面,点击“创建监控面板”,在创建页面选择模板为苍穹监控面板,填写完成后点击“创建”,系统会同时创建该监控面板和对应的监控任务。
• 基础信息
(1) 名称:监控面板,以及自动创建的关联监控对象(比如监控任务等)名称。
(2) 归属项目:该监控项归属的项目(即:gPaaS租户项目)
(3) 选择模版:选择苍穹监控面板
(4) 安装集群:建议选择托管的苍穹集群及命名空间。通过“苍穹监控面板”创建面板后,后台会自动给数据库和中间件监控对象创建对应的采集器容器,该采集器容器会在当前填写的集群对应的命名空间上创建
• 监控对象信息
若非必要,建议不要修改监控对象信息的默认值(比如主机的采集端口、采集路径等)
(1) 主机
添加所有数据库和中间件主机,对主机的cpu、内存、磁盘容量等进行监控。
注:
a). 需要先在数据库和中间件主机上安装node_exporter 采集器,方可通过该界面创建主机监控,详见 node_exporter采集器安装说明
b). k8s 节点主机监控可通过云容器监控进行配置(后续章节介绍)。
(2) 数据库
对苍穹数据库应用进行监控。需填写对应数据库的IP/域名、端口,以及数据库管理员的用户名和密码
(3) 中间件
对苍穹中间件应用进行监控,包括Redis,RabbitMQ和Zookeeper。其中,RabbitMQ监控配置时需要填写该应用对应的登录用户名和密码
按上述步骤配置完后,即可在仪表盘中查看对应的监控图表数据,如下图所示:
2. 苍穹微服务的指标监控配置
(1) 任务名称:该微服务监控的任务名称,后续展示到监控仪表盘中
(2) 归属项目:该监控任务所属项目
(3) 采集模版:选择“苍穹微服务监控”
(4) 采集端口,采集路径,采集周期:使用默认值
(5) 配置方式:选择“自动发现”
(6) 集群:选择需要监控的苍穹集群,该集群需要已托管至gPaaS,同时对应的苍穹服务需要同步至gPaaS中
(7) 命名空间:苍穹应用对应的命名空间
(8) 服务名称:选择同步至gPaaS的服务,可根据需要选择需要监控的苍穹微服务,比如:web,mservice等服务。每个监控任务只能选一个微服务进行监控,如需要监控多个微服务,可对应创建多个监控任务。
(9) 认证:需要开启。对应的用户名和密码在MC中需要配置好。
采集点用户名密码在MC的配置步骤如下:
在环境公共配置项中的 /root/config/common/prop/monitor.properties 增加如下两个配置项:
monitor.healthcheck.account.user 和 monitor.healthcheck.account.pd。
每个配置项的名称和编码保持一致,每个配置项的值可以自定义(如上图所示)。
配置完用户名和密码配置项后,需要对集群进行重新发布才能生效(如上图所示)
按上述步骤配置完后,即可在仪表盘中查看微服务监控图表数据,如下图所示:
3. 苍穹容器、K8S主机指标监控配置
gPaaS已默认配置好对应的指标监控,如下图所示:
二、配置报警策略和通知
(1) 配置告警邮箱信息(2) 配置默认的邮件通知和即时通讯工具通知
(3) 配置报警策略并开启通知
• 针对数据库、中间件及对应主机、苍穹微服务的报警策略,可通过对应的监控任务进行配置,如下图所示:
• 针对苍穹容器的报警策略,可通过对应的监控页面进行配置,如下图所示:
• 针对K8S主机监控的报警策略,可通过对应的监控页面进行配置,如下图所示:
三、监控运维
(1).通过监控概览查询整体的监控指标和报警信息,如下图所示:
(2).通过仪表盘查询详细的监控指标信息,如下图所示:
(3).通过报警事件页面查询详细的报警信息,如下图所示:
(4).通过邮件和即时通讯工具接收报警信息