集群监控

栏目:云苍穹知识作者:金蝶来源:金蝶云社区发布:2024-09-23浏览:1

集群监控

一、概述

本产品为集群监控系统。主要包括线程堆栈、日志查询、调用链查询、实时监控、环境监测等常用监控功能

二、菜单列表

1   应用列表

1)  功能简介

列表展示了应用名、实例id、IP端口、实例启动时间、实例状态等信息。用户可选择某个实例,点击上方操作按钮,进一步查看相应的信息。点击右上角“切换为经典版”可跳回经典版monitor。

2)  界面示例

image-20200827102804429

1.1  线程堆栈

1) 功能简介

该页面展示线程堆栈相关信息,用户可根据线程类型进行切换查看。列表上方按线程状态对线程数进行了统计,点击统计项可看到子项统计信息。列表展示线程堆栈详细信息,如线程统计信息、堆栈信息,点击查看调用链可跳调用链页面进一步查看

注:当出现死锁时,会在页面上方展示死锁相关信息(如下图2所示)

2) 界面示例

image-20200827102952786

image-20200827102952786

1.2  系统属性

1) 功能简介

该页面展示系统属性信息,用户可对Key或Value进行模糊匹配搜索

2) 界面示例

1.3  实时监控

1) 功能简介

从应用列表选择实例并点击实时监控按钮,会弹出新的浏览器tab页,展示实时监控信息。图表会定时动态更新数据,达到实时监控效果

2) 界面示例

1.4  Algox

1) 功能介绍

展示Algox相关指标信息

2) 界面示例

image-20200827103418796

1.5  数据源

1) 功能简介

该页面展示数据源相关信息

2) 界面示例

image-20200827103344973

1.6  内存对象信息

1) 功能简介

该页面展示内存对象信息,用户可根据关键字进行模糊匹配搜索,指定是否仅显示对象,查看前N条等。列表可按实例数量、对象大小进行排序

2) 界面示例

image-20200827103344973

1.7  服务管理

1) 功能简介

服务管理可查看web,rpc,message请求状况,工具栏按钮操作本应用是否对外提供服务,该功能只有管理员有权限使用!

2) 界面示例

image-20200827104433056

1.8  临时表监控

1) 功能简介

    临时表监控用于监控集群中所有节点使用临时表情况,图中借出与回收总数统计是针对集群中临时表的总体监控,正常情况下是相等的(每使用一个临时表都需要回收回来),临时表池统计是在db.pktemp.nopool=false时才会启用临时表池。待回收与待检查是监控集群中使用临时表有没有被正确的回收,使用是否超时(超时间由db.pktemp.timeout_minute配置决定)。临时表名后缀用于区分创建的临时表是属于哪个节点;临时表清理统计,统计出节点出现挂掉而未释放临时表,那么该节点中的临时表会被其他节点所释放掉。


2) 界面示例

2  环境监测

1) 功能简介

环境监测目前提供测速功能,展示访问中间件、数据库等的速度

注:状态值说明,测试时间在(0ms,10ms] 时状态为正常,(10ms,100ms] 为慢,(100ms,6000ms] 为超慢,访问失败为异常 

2) 界面示例

image-20200827104504593

3  日志查询

1) 功能简介

多维度查询查询集群日志,查询出来的日志可点击下载功能加载到本地文件系统,点开更多条件可根据更多参数来过滤日志,默认展示100条,更多条件中可输入查询条数,最多5000条

配置项示例(查询所配置EShttp://172.17.7.37:9200中,索引为basecloud-log-*的日志数据):

System.setProperty("monitor.es.url","http://172.17.7.37:9200");
System.setProperty("monitor.es.index","basecloud-log-");

注:查询时间范围最大为开始时间往后推5天,可通过系统参数修改该范围大小monitor.log.maxSearchRange=5,建议不要设置过大

2) 界面示例

image-20200827104546833

4  分布式锁

1) 功能简介

分布式锁列表展示集群中拥有的所有分布式锁,可看出锁路径,拥有者等,可对锁进行unlock,clearlock

2) 界面示例

image-20200827104715144

5  Redis监控

1) 功能简介

查询集群redis中每个节点的运行信息,最新的20条慢日志,选中界面中的节点下拉选项,查看不同节点的的信息,key与查询按钮用来查询选中节点中对应key的value值

注:目前只支持查询hash,string类型的数据

2)  附加功能

在系统变量里面设置monitor.redis.highlightkeys使系统状态中的key高亮显示,默认connected_clients,used_memory_human,rejected_connections高亮显示

eg:
  System.setProperty("monitor.redis.highlightkeys","connected_clients,used_memory_human,rejected_connections,redis_version,total_system_memory_human");


image-20200827104800616

6  MQ监控

1) 功能简介

查询集群MQ所有队列消息情况,可根据队列名查询,点击相应的队列名可对该队列上的消息进行删除操作

注:只支持RabbitMq

2) 界面示例

image-20200827104858750

7  调用链

1) 功能简介

zipkin查询,配置项说明:

System.setProperty("trace.reporter.zipkin.kafka.url", "172.17.7.78:9092");
System.setProperty("trace.reporter.zipkin.kafka.topic", "basecloud-log");
System.setProperty("trace.enable", "true");
System.setProperty("trace.reporter.type", "zipkin-kafka");
System.setProperty("trace.reporter.zipkin.url", "http://172.17.7.78:9413/api/v1/spans");
System.setProperty("monitor.zipkin.url", "
System.setProperty("trace.reporter.zipkin.kafka.url", "172.17.7.78:9092");
System.setProperty("trace.reporter.zipkin.kafka.topic", "basecloud-log");
System.setProperty("trace.enable", "true");
System.setProperty("trace.reporter.type", "zipkin-kafka");
System.setProperty("trace.reporter.zipkin.url", "http://172.17.7.78:9413/api/v1/spans");
System.setProperty("monitor.zipkin.url", "http://172.17.7.78:9413");

2) 界面示例

image-20200827104942419


集群监控

一、概述本产品为集群监控系统。主要包括线程堆栈、日志查询、调用链查询、实时监控、环境监测等常用监控功能二、菜单列表1 应用列表1) ...
点击下载文档
确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息