电脑桌面
添加蚂蚁七词文库到电脑桌面
安装后可以在桌面快捷访问

用友YonBIP V3.0 (R5_2312_1)旗舰版私有云用户手册-监控中心篇.pdf

用友YonBIP V3.0 (R5_2312_1)旗舰版私有云用户手册-监控中心篇.pdf_第1页
1/93
用友YonBIP V3.0 (R5_2312_1)旗舰版私有云用户手册-监控中心篇.pdf_第2页
2/93
用友YonBIP V3.0 (R5_2312_1)旗舰版私有云用户手册-监控中心篇.pdf_第3页
3/93
第5页!"#$%&'()*+,-./0)10/12345'6789:;<=>?'!"#$%&'()*+,-./.0123-第5页版权©2024用友集团版权所有。未经用友集团的书面许可,本用户手册任何整体或部分的内容不得被复制、复印、翻译或缩减以用于任何目的。本用户手册的内容在未经通知的情形下可能会发生改变,敬请留意。请注意:本用户手册的内容并不代表用友网络所做的承诺。第5页目录第一章产品简介.........................................61.1产品架构.........................................61.2系统说明.........................................61.3使用方法.........................................71.4私有云安装方法...................................8第二章Portal.....................................142.1系统运行参数....................................142.2链路拓扑........................................142.3微服务及容器....................................152.4中间件、资源池、主机..........................16第三章线程监控........................................183.1产品设计........................................183.2容器线程列表....................................183.3线程详情........................................193.3.1线程详情页......................................193.3.2线程剖析........................................193.4线程快照........................................203.5容器控制台......................................22输入exportduration=10然后再点击生成火焰图,可以调整火焰图采样时长:.................................................................24调整窗口大小,内容自动适应:......................................253.6监控历史........................................26第四章BPR....................................284.1产品设计........................................284.2BPR录制........................................284.3BPR详情........................................304.4BPR列表........................................34第五章哈勃监控.........................................0第5页5.1报警中心.........................................05.1.1当前报警.........................................05.1.2报警查询.........................................15.1.3策略管理.........................................35.1.4通知管理.........................................65.1.5通道管理.........................................75.1.6基础信息........................................115.2日志中心........................................125.2.1集群事件日志....................................125.2.2业务日志........................................135.2.3访问日志........................................165.2.4容器日志........................................175.2.5警告查询........................................175.3指标监控........................................175.3.1微服务监控......................................175.3.2容器监控........................................215.3.3主机监控........................................225.3.4中间件监控......................................235.3.5服务概览........................................245.3.6主机概览........................................255.3.7进程监控........................................255.3.8集群监控........................................265.3.9微服务总览......................................275.4链路分析........................................285.4.1开启哈勃监控....................................285.4.2录制业务操作....................................315.4.3查阅哈勃报告....................................325.5性能工具........................................405.5.1火焰图..........................................40第5页5.5.2JVM性能诊断.....................................435.5.3JMX监控面板.....................................445.5.4SQL强杀........................................455.6运维工具........................................475.6.1远程主机管理....................................475.6.2远程任务管理....................................48第六章用户洞察........................................506.1概览统计........................................506.1.1概览............................................506.1.2领域............................................506.1.3角色工作台......................................516.1.4体验............................................516.1.5用户............................................526.1.6员工详情看板....................................526.2会话分析........................................536.3错误分析........................................54第七章系统与项目管理..................................557.1用户与用户管理..................................557.1.1管理员账户......................................557.1.2添加用户并授权..................................557.2Link远程接入配置方法...........................56第5页第一章产品简介1.1产品架构新一代YonBIP监控中心,简称YMC。以实时监控、快速诊断定位问题为主要特点,通过主机-微服务-容器-中间件多级资源监控、微服务全链路监控、实时线程监控分析、BPR业务录制诊断和云端远程监控等能力,为YonBIP提供从公有云到专属云的多样化监控与问题诊断分析服务。YMC模块主要包括YMC-Link(中控台),YMC-Portal(门户),YMC-Proxy(客户端代理),同时集成了哈勃监控的日志分析、报警、监控指标、链路分析、运维工具、性能分析功能等模块能力。采用云加端的架构设计,实现远程实时监控客户项目现场系统,方便发现、分析现场项目问题。1.2系统说明第6页1)Portal门户入口2)Link中控台入口https://ymc.{环境配置域名}https://ymclink.yonyoucloud.com3)接入YMC要求:1.微服务使用二方包7.9.0-RELEASE+版本。2.执行流水线,使二方包引入生效,会自动接入到YMC系统。1.3使用方法1)注册环境所部署的友互通账号(如果有账号,可以跳过此步):<parent><groupId>com.yonyou.iuap</groupId><artifactId>iuap-2nd-party</artifactId><version>7.2.0-RELEASE</version></parent>第6页2)访问YMC门户页并登录友互通:https://ymc.{环境域名}生产环境域名:yonyoucloud.com研发网络环境域名:yyuap.com私有云环境地址:https://{技术中台环境域名}/ymc3)通知YMC系统管理员使用管理员角色账号为自己授权普通用户角色并授权所需要的环境。4)授权后重新退出再登录一次,即可正常使用YMC了。1.4私有云安装方法1.4.1安装说明安装YonBIP监控中心前建议先安装以下产品:友互通、技术平台、YMS控制台、统一前端引擎。第7页1.4.2开始安装点击ymc产品盘的【立即添加】。1.4.3选择资源池1.4.4中间件资源配置•选择技术中台nginx;•其余选装,非必装;•如果选择了数据源,需要在第4步规划对应的数据源。第7页1.4.5规划数据源跳转YMS控制台规划数据源。第7页1.4.6YMS控制台配置登录YMS控制台,选择环境,手动配置以下三项其中:•${envCode}为当前安装环境code;•${password}没有规则限制,可以用密码生成工具生成,建议长度8-32位,密码复杂度尽量高一些;ymc_basic_auth_username=ymc-${envCode}ymc_basic_auth_password=${password}ymc_server_url=http://${envCode}-iuap-ymc-server.prod1.iuap-yks.local第7页1.4.7安装配置完成后在安装器中点击重新检测,然后点击立即安装。1.4.8登录监控中心安装完成后点击产品管理,点击进入产品,成功跳转到ymc登录页代表安装成功。第7页第8页第二章Portal2.1系统运行参数实时展示当前YonBIP项目、环境的运行信息,活跃用户数、任务数、QPS、报警数,以及CPU、内存、网络的总体使用情况。说明:Ø30分钟活跃用户数:系统会统计30分钟内的活跃用户数,点击可以查看具体用户30分钟内的请求数排名;Ø实时任务数:点击可以展示当前系统任务数,即当前活跃的线程情况;ØQPS:统计Ingress入口每秒的请求数,反馈入口请求量情况;ØTPM:每分钟系统的任务量,反馈系统当前分钟级的吞吐量;Ø环境选择:可以切换不同环境使用。2.2链路拓扑实时展示,从Ingress入口到微服务,再到中间件的调用链路。第9页说明:Ø展示当前环境IngressController的QPS,以及上下行带宽量;Ø按领域展示当前环境微服务执行任务数情况,按颜色区分任务数多少及是否异常,并且可以点击钻取到微服务线程级监控页面;Ø展示微服务与中间件的关联关系,也可反向展示中间件与微服务的关联关系(待完成)。2.3微服务及容器展示当前接入到YMC的所有微服务及容器。微服务展示领域、总资源、容器配置、容器数、异常容器数、TPM、当前任务数、活跃用户数,并可查看微服务下的线程信息及历史情况;容器展示主机IP、容器IP、状态、TPM、requests(请求数)、bgTasks(后台任务数)、CPU、内存、JVM信息,并可查看容器中的线程信息及历史请求,以及直接进入到容器控制台。所有字段都可以执行排序操作。第10页微服务及容器可执行对单个微服务或容器的操作:Ø微服务可执行线程、微服务监控操作;Ø容器可执行线程、控制台、最近请求、指标监控操作。2.4中间件、资源池、主机这里展示中间件、资源池、主机指标监控信息。第11页说明:Ø中间件、资源池可以查看状态及CPU、内存信息;Ø主机可以查看CPU、内存、磁盘、网络信息;Ø主机的总容器数是指非业务容器以为的容器数,鼠标划上可以展示具体容器信息;Ø主机的业务容器数是指接入到YMC系统的容器,点击可以直接进入到容器的线程信息页面。第12页第三章线程监控3.1产品设计线程监控是YMC非常核心的功能,系统会实时采集微服务当前线程的运行信息,支持刷新采集、生成快照、快照列表、最近请求,并可以直接进入容器控制台。3.2容器线程列表实时采集到当前系统的所有线程运行信息。第13页说明:Ø按容器展示当前系统所有执行任务的线程,包括CPU、内存、JVM内存、响应时间;Ø线程列表展示,TraceID、业务操作、总耗时、SQL耗时、RPC耗时、线程名、调用方法、SQL数量、读结果耗时、结果集、网络上下行流量、未关闭连接数、总连接数、客户端IP地址、租户ID、用户名;ØTraceID,标记了[*RPC]表示traceID不等于spanID,反之traceID等于spanID表示是入口请求,及非RPC请求;Ø单击线程列表的每行记录,会在下面展示SQL堆栈、耗时、响应行数、开始执行时间、数据源、connId,及线程堆栈信息;Ø点击TraceID或双击线程列表每行记录,会右侧抽屉拉出线程详情页面。3.3线程详情3.3.1线程详情页可以刷新当前线程、强杀当前线程、生成线程快照,页面展示具体的线程信息、SQL信息、调用方法、线程堆栈、SQL堆栈等信息。3.3.2线程剖析第13页Ø线程信息。包括实例名、线程名称、traceid、总耗时、业务操作名称、线程状态、当前事件、性能统计指标数据、远程调用方法名、客户端地址、操作用户id、租户id;Ø实时刷新开关。默认自动开启。开启后以2s间隔进行线程采样,直到任务停止或手动关闭刷新开关;Ø线程实时数据趋势图。显示SQL数量、结果集大小、RPC调用次数,以及SQL耗时、读结果集耗时、RPC耗时、总耗时(合并到一张面积图)曲线数据;Ø线程剖析。展示线程采样堆栈内容。多个调用会产生多个线程堆栈。nCPU:代表采集到CPU占用的方法次数;nMax:代表被采集到单个方法CPU占用最大次数;n通过红色标识文字找到标识CPU占用最大次数的堆栈信息。3.4线程快照可以当前刷到的线程信息,以快照的形式保存下来,方便后面查看,及分享给他人第14页查看,支持快照分享、导出、删除功能。说明:Ø可以根据时间范围筛选生成过的线程快照;Ø线程列表操作和上节提到的操作方式完全一致。点击分享,生成分享链接,点击复制,会将分享地址复制到剪切板:浏览器输入分享地址,输入验证码,可以查看纯静态页面的线程报告形式,便于协作;点击导出,可以下载到该静态页面:3.5容器控制台操作路径有:容器->操作->控制台,线程监控->操作->控制台。可以非常方便的进入容器中,做shell操作,自动支持bash、sh,并提供快捷操作:日志、Arthas、生成火焰图、下载火焰图、Dump堆内存、下载堆内存。第16页可以在“日志”、“控制台”之间切换,日志可以实时查看容器日志:一键进入Arthas:第17页一键生成火焰图:下载火焰图:输入exportduration=10然后再点击生成火焰图,可以调整火焰图采样时长:第18页双击或范围选择,即可自动复制内容到剪切板:常用火焰图指令:调整窗口大小,内容自动适应:exportduration={整数值}//改变火焰图的采样时间,建议不超过120sexporttype=”memory”//更改火焰图类型为内存火焰图第19页3.6监控历史1)最近请求:(线程监控->操作->最近请求,容器->操作->最近请求)第20页2)指标监控:(微服务->微服务监控->指标监控,容器->操作->指标监控,线程监控->操作->指标监控)第22页第四章BPR4.1产品设计以前端录制的方式,采集分析业务操作性能问题,类似哈勃录制链路,设计上比哈勃录制链路实现更简单、可靠。4.2BPR录制由业务中台-工作台-开发调试-开始录制触发,点击录制按钮,可以选择录制BPR报告或者哈勃报告,或者两个报告同时录制。开始录制:结束录制:第22页第23页4.3BPR详情1、YMCBPR入口:2、点击浏览,参考详情:第24页第25页第26页第27页4.3.1.1线程剖析Ø线程剖析。展示线程采样堆栈内容。多个调用会产生多个线程堆栈。nCPU:代表采集到CPU占用的方法次数;nMax:代表被采集到单个方法CPU占用最大次数;n通过红色标识文字找到标识CPU占用最大次数的堆栈信息。4.4BPR列表第27页查看BPR报告列表,支持浏览、分享、下载、哈勃报告、删除功能。第五章哈勃监控哈勃监控是YonBIP第一个世代的监控产品,如今以功能整合的方式将绝大部分之前用户认可和需要的监控服务能力移植到了YMC中。整合入YMC后,哈勃监控继续发挥其强大的多维数据收集与长效分析的优势,并将功能模块重新整合为负责监控报警的报警中心,负责集群事件、访问日志、业务日志、容器日志的日志中心,负责主机、微服务、容器、中间件等各层级监控面板的指标监控,负责链路追踪(大家所熟悉的哈勃报告)链路分析,涵盖火焰图、JVM性能分析、JMX监控、SQL强杀的性能工具,构建起五大监控能力与工具体系。5.1报警中心报警中心负责配置和接收监控报警规则,通过报警驱动问题排查和处理。报警中心涵盖报警策略管理、报警通道管理、报警通知对象管理、报警基础信息管理管理功能模块,同时提供当前报警、报警查询两个报警查询和处理模块。5.1.1当前报警当前告警是指当前时间的一小时内、正在发生且未解除的严重级别的告警,在当前告警模块,系统将以主机、微服务、集群、中间件、自定义5类的实体级对象进行告警信息聚合。当前告警是为了对频繁和大量的告警信息进行信息降噪,让用户可快速发现当前时段最重要的问题,所有告警内容依然同时可以在报警查询模块查询。用户手册1/935.1.1.1对象类型筛选在右上角的对象类型列表,紫色代表了主机、蓝色代表微服务、红色代表集群、橙色为中间件、绿色为自定义类型,点击后可筛选告警结果为仅为当前类型,再次点击该类型名称可以恢复全部类型数据。对象类型括号内的数字代表该类型的有告警对象数量。5.1.1.2对象筛选对象信息以复合标签形式显示,其中左侧的名称为实体对象名称,如主机名称,红色数字圈代表该对象的当前告警数量,最后的彩色标签代表对象类型。5.1.1.3定时自动刷新开启定时刷新后,当前告警列表会以每5秒自动刷新的方式高频刷新当前告警内容。5.1.2报警查询报警查询可对所有报警内容进行查询和筛选。1.通过筛选区可设置报警的相关筛选条件,例如环境、状态、级别、时间范围等。2.通过报警策略列表了解相关报警策略的报警数量。3.通过报警状态筛选,可进一步选择对应的报警内容。4.通过报警等级筛选可进一步选择对应报警等级内容。5.通过直方图可对具体时间点的异常峰值进行时间筛选。用户手册2/935.1.2.1报警报告查看对需要详细了解的报警,可点击操作-查看按钮进行报告详情内容的查看。1.报告内容会自动聚合相同内容的相近时间报告。2.用户可选择点击右上角的分享按钮复制报告的在线阅读地址,并发送给相关用户查看。用户手册3/935.1.3策略管理在策略管理里可维护或新增报警策略。为了使报警策略可以匹配多种操作,报警策略并不直接绑定相关通知人,通知人需要额外在通知管理中维护。1.每个报警策略可添加无限数量的监控项,每个监控项指定一个具体的监控类型和对象。用户手册4/932.不同的监控对象会有不同的默认阈值,用户可手动调整预设值。报警策略监控项阈值Kubernetes_核心数据中心_严重事件集群发生严重事件Warning|Error健康监控中间件_生产环境_核心数据中心_Elasticsearch集群健康状态告警堆内存使用率过高超过80%探针状态PendingTask超过10中间件_生产环境_核心数据中心_Etcd探针状态中间件_生产环境_核心数据中心_Kafka未复制分区异常消息积压超过30000条探针状态中间件_生产环境_核心数据中心_MySQL连接数告警超过80个状态监控用户手册5/93慢查询监控超过3s探针状态中间件_生产环境_核心数据中心_RabbitMQ队列状态异常集群节点失联连接数过多告警超过10000个服务终止告警队列长度异常超过100000条探针状态中间件_生产环境_核心数据中心_Redis异常重启内存负载超过80%内存碎片率过高超过150%QPS超过10000条阻塞连接数过高超过5条命中率检测低于70%未启动告警并发连接数过多超过3000个中间件_生产环境_核心数据中心_ZooKeeper存在大量请求堆积超过100条连接数异常超过1000条follower失联无leader异常未启动告警主机_生产环境_核心数据中心_资源池1磁盘写速率异常超过150MB/sinode使用率超过90%用户手册6/93/data目录磁盘使用率超过85%CPU15分钟负载超过20负载值磁盘读速率异常超过150MB/s探针状态网络出口带宽超过100MB/s网络入口带宽超过100MB/s磁盘I/O监控超过100MB/sswap使用率超过80%CPU5分钟负载超过20负载值时间差超过80s启动时间少于80s/root目录磁盘使用率超过90%内存负载告警超过95%CPU负载告警超过120%微服务_生产环境_核心数据中心_平台1URL健康检测大于等于400或小于200,状态码容器内存使用率超过95%容器CPU使用率超过300%自定义_生产环境_核心数据中心_SQL慢日志自定义_生产环境_核心数据中心_生成火焰图容器CPU使用率超过300%容器内存使用率超过95%服务健康检测失败5.1.4通知管理通知管理提供了灵活的通知人及通知组管理功能。通知人员默认创建isvadmin用户。用户手册7/935.1.5通道管理目前哈勃报警中心支持友空间、邮件、钉钉、企业微信通知、Webhook通道方式,具体配置使用方法如下。5.1.5.1友空间通知AccessKey:访问友户通的key的凭证(对应yht_secretKey)SecretKey:访问友户通的key(对应yht_sysId)测试手机号:用于测试配置是否连通,必须是在友户通中注册的手机号5.1.5.2邮件通知账号:发件人的邮箱账号密码:发件人的邮箱密码SMTP服务器:服务器域名地址(私有云填写IP或者添加DNS解析)端口:默认的端口号昵称:发件人的nickname用户手册8/93测试邮件地址:收件人的邮箱账号5.1.5.3钉钉通知1.使用钉钉发送报警需要企业机构注册一个自己的组织,用主管理员账号登录,进入应用管理模块,创建一个自建应用。2.进入创建好的自建应用可以获取页面需要的三个参数(AGENT-ID、APP-KEY、APP-SECRET)3.钉钉手机号:要填写钉钉注册的企业通讯录中的联系人手机号,否则发不出来报警通知5.1.5.4企业微信通知1.使用企业微信发送报警通知需要在自己的企业微信中,通过管理员角色注册一个的应用,该应用就是用来发送报警消息到应用中的联系人;用户手册9/932.获取页面的参数3.填写一个测试手机号,手机号需要在该企业微信的联系人名单中,否则无法发送消息。注意:需要把自己服务的出口IP设置进入钉钉或者企业微信的IP白名单之中。5.1.5.5Webhook通知通过webhook方式进行第三方消息推送。用户手册10/935.1.5.5.1接口模板客开提供接口地址Post标准格式:{"tel":"",//手机号,多个会以逗号分隔"email":"",//邮箱,多个会以逗号分隔"content":"",//报警内容"title":""//报警标题,可以作为邮箱的标题}5.1.5.5.2报警发送webhook配置1.将数据库表中monitor_notify_strategy中的channels字段更改为webhook字样,表示发送报警渠道更改为调用外部封装的webhook。如果想要发送email可以在email后面新增webhook字样,以逗号分隔。selectchannels,notify_groupfrommonitor_notify_strategywherenotify_grouplike'ISV管理员-%'andis_valid=1;#通知策略名称:ISV管理员增加webhook通知渠道updatemonitor_notify_strategysetchannels=concat(channels,',webhook')wherenotify_grouplike'ISV管理员-%'andis_valid=1;#通知策略名称:ISV管理员更改为仅支持webhook通知渠道updatemonitor_notify_strategysetchannels='webhook'用户手册11/93wherenotify_grouplike'ISV管理员-%'andis_valid=1;2.全链路监控服务部署设置环境变量为:alert_notify_webhook为客开的webhook接口。可在yms配置中选择对应环境-技术中台-全链路监控,在通用配置中新增变量:alert_notify_webhook及对应的url绝对地址,配置完成后选择配置文件预览并发布,重启全链路监控。注意事项:1.哈勃监控中心-报警中心-通知人:选择的通知人需要填充手机号和邮箱信息2.新增用户的流程:•admin用户登录技术中台-选择用户管理-新增用户-填入实际信息。•登录isvadmin,进入哈勃监控中心-报警中心-通知管理-通知人新增刚刚的用户。5.1.6基础信息用户手册12/93基础信息目前提供主机资源池负责人管理、微服务负责人管理及健康检查地址管理。l维护基础信息,可以在告警时确定资源池或微服务、对应的负责人。5.2日志中心日志中心主要功能是展示日志数据的聚合统计。日志中心将采集的各类日志信息,包括访问日志、业务日志、容器日志等写入日志索引服务,并通过日志查询系统提供数据查询与分析、可视化等能力。5.2.1集群事件日志集群事件日志模块对K8s集群的事件消息进行统一汇总并提供相关原始日志分析。5.2.1.1集群事件查询在事件查询中,可查询最新发生的集群事件。1.使用筛选区的功能选择想要查看的数据中心、环境、微服务、事件类型。2.可使用筛选区的时间筛选功能指向具体的时间段,默认查询范围为当天。3.可使用查询关键词查询具体的错误信息关键词内容。用户手册13/935.2.1.2集群事件分析查询分析是将采集的集群事件日志信息写入索引服务,并通过日志分析工具提供数据查询与分析、可视化等能力。在查询分析模块,可以查看事件的原始日志信息以便进行问题分析。日志查询区可设置查询的条件,包括查询内容、查询时间范围和数据过滤条件。5.2.2业务日志用户手册14/93业务日志主要功能是展示微服务应用日志并进行相关的数据聚合统计。5.2.2.1开启业务日志新版日志收集组件iuap-ymc-log-collector默认值收集ingress访问日志及k8s集群事件日志,如需收集业务日志需要手动开启。操作步骤如下:1.登录到yms控制台,然后在yms控制台监控中心产品下先增加分组。2.新增配置项键:ENABLE_BUSINESS,值:true3.发布此配置项。4.登录所在环境的安装器主机,声明ymc产品的InstallerTaskPath目录:u进入jobs目录:cd/data/iuap-installer/data/product_install/jobs/u找到ymc产品的最新job:ll|grepymcu声明ymc产品的InstallerTaskPath(如下图):用户手册15/93u进入到所在环境的安装器主机中,进入日志收集组件iuap-ymc-log-collector的资源部署目录(示例目录,仅供参考,以环境实际目录为准):/data/iuap-installer/ypr/Tools/iuap-ymc-log-collector/v1.0.0/202306211515-10/iuap-ymc-log-collector_202306211515-10_x86_64/resourcesu执行install.sh脚本:./install.sh如下图所示:5.2.2.2业务日志分析日志日志分析支持可视化展示您的业务日志统计与分析结果。展示内容包括:l微服务排行:对微服务调用次数和调用占比进行统计排行。l日志分布直方图主要展示查询到的日志在时间上的分布。交互方式:1.鼠标指向绿色数据块时,可以查看该数据块代表的时间范围和日志命中次数。2.单击绿色数据块,可以查看更细时间粒度的日志分布,同时在原始日志页签中同步展示指定时间范围内的查询结果。用户手册16/933.在直方图上按住鼠标左键并框选直方图区域,可做手动时间范围进一步筛选。5.2.3访问日志访问日志主要功能是展示某个应用的访问日志并进行相关的数据聚合统计。日志中心将Ingress服务采集的访问日志信息写入索引服务,提供数据查询与分析、可视化等能力。用户手册17/93私有云界面Ø日志分布直方图主要展示查询到的日志在时间上的分布。支持按微服务进行日志筛选。5.2.4容器日志Ø容器日志查询:支持高级语法查询,公有云项目适用SLS查询语法,私有云项目适用KQL语法查询;Ø容器日志筛选:支持按微服务进行日志筛选。5.2.5警告查询对微服务产生警告的内容进行快速查询,帮助问题定位分析。Ø警告请求。查看产生警告事件的请求日志。n产生警告的请求情况包括:请求耗时大于5s的,SQL执行数量大于2000,连接泄露大于0,RPC调用次数大于50。日志包含traceid、spanid、、pspanid、tenantid、userid等来源信息,以及远程调用方法、SQL统计指标数据、远程调用指标数据。n支持按照微服务、traceid和调用方法名称,以及时间段进行查询过滤。Ø警告SQL。查看最近产生警告的SQL日志。n产生警告的SQL情况包括:SQL结果集大于1万的,SQL执行耗时大于2秒。日志包含traceid、spanid、、pspanid、tenantid、userid等来源信息,以及SQL语句。n支持按照微服务、traceid和SQL语句,以及时间段进行查询过滤。5.3指标监控指标监控是对微服务、容器、主机、中间件以及总览概况的数据指标监测,并通过监控仪表盘对相应指标数据的趋势、分布、状态、排行等进行监控和分析的日常运维监控数据中心。5.3.1微服务监控用户手册18/93微服务监控是对全部接入微服务的整体监控,在微服务详情检查中集成了服务监控、访问日志、集群事件、业务日志、火焰图、JVM性能分析、容器日志、日志浏览、容器列表、当前报警等多项面板和能力,可实现对微服务运行态的快速检查分析。5.3.1.1微服务状态列表以可视化图示方式展示微服务列表,展示包括微服务名称、微服务容器数量、微服务及容器状态。红色:代表全部容器存在异常;橙色:部分容器存在异常;绿色:所有容器运行正常。5.3.1.2微服务详情面板-服务监控Ø展示系统指标,包括cpu负载率、内存负载、网络流入速率、网络流出速率指标趋势图;Ø展示微服务业务活跃度,包括活跃用户数、TPM趋势图,以及微服务活跃数据日志记录;Ø支持按时间范围进行数据查询。用户手册19/935.3.1.3微服务详情面板-访问日志同日志中心-访问日志功能,日志结果已关联当前选择的微服务。5.3.1.4微服务详情面板-业务日志同日志中心-业务日志功能,日志结果已关联当前选择的微服务。用户手册20/935.3.1.5微服务详情面板-集群事件同日志中心-集群事件查询功能,日志结果已关联当前选择的微服务。5.3.1.6微服务详情面板-火焰图同性能工具-火焰图功能,火焰图列表已关联当前选择的微服务。5.3.1.7微服务详情面板-JVM性能分析同性能工具-JVM性能分析功能,报告列表已关联当前选择的微服务。用户手册21/935.3.1.8微服务详情面板-容器日志同日志中心-容器日志分析,日志结果已关联当前选择的微服务。5.3.1.9微服务详情面板-日志浏览可查看当前微服务各容器日志目录并浏览和下载所需的日志文件,日志文件自动按大小切割。5.3.2容器监控Ø指标监控趋势图。显示CPU负载、内存负载、网络流入、网络流出趋势图。显示当前所选微服务下所有容器的CPU负载曲线,可点击应用列表切换应用。用户手册22/93Ø容器数据筛选。每张趋势图下方列表中,选择单个容器可仅查看该容器数据。Ø业务活跃度。包括30分钟活跃用户数趋势图和TPM。同时显示微服务活跃指标明细表。包括微服务名称、总资源(CPU核数/内存容量)、容器配置、容器数、异常容器数、活跃用户数、TPM、任务数。Ø时间筛选与缩放。默认今天,最长30天。支持在趋势图上鼠标框选数据时间范围进行缩放,缩放时间在指标监控中全局应用。5.3.3主机监控Ø资源筛选。支持按照资源池、主机、时间范围进行资源和数据筛选用户手册23/93Ø服务总览。监控主机监控总数,以及主机明细表;明细表数据包括:IP、主机名、运行时间、总内存、总核数、5分钟负载率、CPU使用率、内存使用率、分区使用率、最大读取速度、最大写入速度、连接数、Time_wait数量、下载带宽、上传带宽;明细表支持按任意指标升降序排列Ø主机监控面板。统计单主机重点监控指标数据和趋势。n核心指标:在线时长、核数、内存容量、5分钟平均负载、内存使用率、数据分区使用率;n负载趋势:1分钟、5分钟、15分钟负载趋势图;nCPU使用率:用户态使用率趋势、内核态使用率趋势、软中断的CPU使用率趋势、最大核数使用率趋势、IO等待率、系统被其他虚拟机占用CPU率;nCPU上下文切换次数趋势、CPU中断数趋势、内存负载、内存状态分布、网络上下行速率趋势、TCP连接数趋势、IO活动趋势、磁盘挂载使用率、磁盘带宽、磁盘IO趋势、磁盘操作、文件描述符等趋势图。5.3.4中间件监控中间件监控面板:用户手册24/93Ø按照中间件类型进行监控面板查看,支持Etcd、Kafka、MongoDB、MySQL、PolarDB、PostgreSQL、RabbitMQ、Redis、Zookeeper中间件监控(私有云环境按实际部署的中间件类型可查看);Ø支持按微服务、实例、时间范围进行筛选查询。5.3.5服务概览查看所有微服务调用和资源利用情况,采用5分钟间隔实时数据,及时发现最新问题。1.通过服务概览查看全部微服务的调用成功率、平均响应时间、调用数、错误调用数趋势图。2.在服务列表区,可通过平均响应时间、调用数、慢调用数、错误调用数指标名称右方的排序按钮对指定的指标进行升降序排序。Ø服务资源消耗可通过CPU使用率、内存使用率、内存使用量、磁盘写入、磁盘读取、网络流入、网络流出指标名称右方的排序按钮对指定的指标进行升降序排序,也可以通过右上角的搜索搜索指定的微服务。用户手册25/935.3.6主机概览查看所有主机的资源利用情况,采用5分钟间隔实时数据。1.在主机概览查看全部主机的CPU使用率、内存使用率、磁盘使用率、网络流入趋势图。2.在主机列表区,可通过CPU使用率、内存使用率、内存使用量、磁盘写入、磁盘读取、网络流入、网络流出指标名称右方的排序按钮对指定的指标进行升降序排序,也可以通过右上角的搜索搜索指定的主机名。5.3.7进程监控用户手册26/93Ø可对主机的进程数据进行实时监控。Ø支持按资源池查找主机。Ø支持按主机筛选。Ø支持进程级的CPU负载、内存使用率等指标实时趋势监看。Ø支持单主机的17个详细监看面板。5.3.8集群监控用户手册27/93集群监控可对Kubernetes集群进行多层面监控,支持自建K8s集群接入。包括以下内容:ØKubernetes总览面板:对集群中体指标监控;ØCoreDNS监控面板:对CoreDNS核心指标进行实时监控;ØKubeAPIServer监控面板:对KubeAPIServer核心指标进行实时监控;ØKubeController监控面板:对KubeController核心指标进行实时监控;ØKubeScheduler监控面板:对KubeScheduler核心指标进行实时监控。5.3.9微服务总览对所有微服务的核心指标进行汇总实时监控。用户手册28/935.4链路分析链路追踪也就是哈勃监控中老用户所熟悉的哈勃报告录制与分析功能,具有RPC、HTTP、SQL、Redis、分布式事务、异常日志、异步消息、DML语句、MDDRule等丰富报告数据支持诊断,判断复杂微服务环境下的异常问题点。Ø哈勃报告录制:n在工作台-个人头像-开发调试-开始录制处开启录制;n哈勃报告支持链路录制的同时录制用户操作界面视频;n操作录制建议时间在5秒以上,5分钟以内。5.4.1开启哈勃监控5.4.1.1后端类型应用开启哈勃监控1.登录BIP系统。2.点击YMCCloud菜单下的微服务管理目录:用户手册29/933.输入要开启的应用名称,搜索后点击该应用的卡片,进入应用详情页。4.在应用详情页中,点击属性页签后,点击编辑按钮。用户手册30/935.找到启用哈勃监控项,选中文字前复选框,开启哈勃监控6.点击保存按钮后,更新配置并重启应用5.4.1.2前端类型应用开启哈勃监控1.修改前端工程,在前端工程中引入哈勃js脚本文件PlainText<scriptsrc="技术中台域名/fe/lib/iUAP-insight-private.min.js"</script>2.在前端页面中增加开启监控按钮,其对应操作代码如下用户手册31/93PlainTextuis.start({trackerUrl:"技术中台域名/iUAPInsight/real-time-collect",userId:'',//cookie中的userIdsiteId:'private',});3.在前端页面中增加Hubble录制按钮,其对应操作代码如下...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

用友YonBIP V3.0 (R5_2312_1)旗舰版私有云用户手册-监控中心篇.pdf

您可能关注的文档

确认删除?
回到顶部
客服QQ
  • 客服QQ点击这里给我发消息
QQ群
  • 答案:my7c点击这里加入QQ群
支持邮箱
微信
  • 微信