集群监控
一、概述
本产品为集群监控系统。主要包括线程堆栈、日志查询、调用链查询、实时监控、环境监测等常用监控功能
二、菜单列表
1 应用列表
1) 功能简介
列表展示了应用名、实例id、IP端口、实例启动时间、实例状态等信息。用户可选择某个实例,点击上方操作按钮,进一步查看相应的信息。点击右上角“切换为经典版”可跳回经典版monitor。
2) 界面示例
1.1 线程堆栈
1) 功能简介
该页面展示线程堆栈相关信息,用户可根据线程类型进行切换查看。列表上方按线程状态对线程数进行了统计,点击统计项可看到子项统计信息。列表展示线程堆栈详细信息,如线程统计信息、堆栈信息,点击查看调用链可跳调用链页面进一步查看
注:当出现死锁时,会在页面上方展示死锁相关信息(如下图2所示)
2) 界面示例
1.2 系统属性
1) 功能简介
该页面展示系统属性信息,用户可对Key或Value进行模糊匹配搜索
2) 界面示例
1.3 实时监控
1) 功能简介
从应用列表选择实例并点击实时监控按钮,会弹出新的浏览器tab页,展示实时监控信息。图表会定时动态更新数据,达到实时监控效果
2) 界面示例
1.4 Algox
1) 功能介绍
展示Algox相关指标信息
2) 界面示例
1.5 数据源
1) 功能简介
该页面展示数据源相关信息
2) 界面示例
1.6 内存对象信息
1) 功能简介
该页面展示内存对象信息,用户可根据关键字进行模糊匹配搜索,指定是否仅显示对象,查看前N条等。列表可按实例数量、对象大小进行排序
2) 界面示例
1.7 服务管理
1) 功能简介
服务管理可查看web,rpc,message请求状况,工具栏按钮操作本应用是否对外提供服务,该功能只有管理员有权限使用!
2) 界面示例
1.8 临时表监控
1) 功能简介
临时表监控用于监控集群中所有节点使用临时表情况,图中借出与回收总数统计是针对集群中临时表的总体监控,正常情况下是相等的(每使用一个临时表都需要回收回来),临时表池统计是在db.pktemp.nopool=false时才会启用临时表池。待回收与待检查是监控集群中使用临时表有没有被正确的回收,使用是否超时(超时间由db.pktemp.timeout_minute配置决定)。临时表名后缀用于区分创建的临时表是属于哪个节点;临时表清理统计,统计出节点出现挂掉而未释放临时表,那么该节点中的临时表会被其他节点所释放掉。
2) 界面示例
2 环境监测
1) 功能简介
环境监测目前提供测速功能,展示访问中间件、数据库等的速度
注:状态值说明,测试时间在(0ms,10ms] 时状态为正常,(10ms,100ms] 为慢,(100ms,6000ms] 为超慢,访问失败为异常
2) 界面示例
3 日志查询
1) 功能简介
多维度查询查询集群日志,查询出来的日志可点击下载功能加载到本地文件系统,点开更多条件可根据更多参数来过滤日志,默认展示100条,更多条件中可输入查询条数,最多5000条
配置项示例(查询所配置EShttp://172.17.7.37:9200中,索引为basecloud-log-*的日志数据):
System.setProperty("monitor.es.url","http://172.17.7.37:9200"); System.setProperty("monitor.es.index","basecloud-log-");
注:查询时间范围最大为开始时间往后推5天,可通过系统参数修改该范围大小monitor.log.maxSearchRange=5,建议不要设置过大
2) 界面示例
4 分布式锁
1) 功能简介
分布式锁列表展示集群中拥有的所有分布式锁,可看出锁路径,拥有者等,可对锁进行unlock,clearlock
2) 界面示例
5 Redis监控
1) 功能简介
查询集群redis中每个节点的运行信息,最新的20条慢日志,选中界面中的节点下拉选项,查看不同节点的的信息,key与查询按钮用来查询选中节点中对应key的value值
注:目前只支持查询hash,string类型的数据
2) 附加功能
在系统变量里面设置monitor.redis.highlightkeys使系统状态中的key高亮显示,默认connected_clients,used_memory_human,rejected_connections高亮显示
eg: System.setProperty("monitor.redis.highlightkeys","connected_clients,used_memory_human,rejected_connections,redis_version,total_system_memory_human");
6 MQ监控
1) 功能简介
查询集群MQ所有队列消息情况,可根据队列名查询,点击相应的队列名可对该队列上的消息进行删除操作
注:只支持RabbitMq
2) 界面示例
7 调用链
1) 功能简介
zipkin查询,配置项说明:
System.setProperty("trace.reporter.zipkin.kafka.url", "172.17.7.78:9092"); System.setProperty("trace.reporter.zipkin.kafka.topic", "basecloud-log"); System.setProperty("trace.enable", "true"); System.setProperty("trace.reporter.type", "zipkin-kafka"); System.setProperty("trace.reporter.zipkin.url", "http://172.17.7.78:9413/api/v1/spans"); System.setProperty("monitor.zipkin.url", "
System.setProperty("trace.reporter.zipkin.kafka.url", "172.17.7.78:9092"); System.setProperty("trace.reporter.zipkin.kafka.topic", "basecloud-log"); System.setProperty("trace.enable", "true"); System.setProperty("trace.reporter.type", "zipkin-kafka"); System.setProperty("trace.reporter.zipkin.url", "http://172.17.7.78:9413/api/v1/spans"); System.setProperty("monitor.zipkin.url", "http://172.17.7.78:9413");
2) 界面示例
集群监控
本文2024-09-23 00:28:09发表“云苍穹知识”栏目。
本文链接:https://wenku.my7c.com/article/kingdee-cangqiong-139659.html