【熊说星空认证】系统管理员:私有云运维与性能优化
个人笔记汇总菜单:【熊说星空认证】系统管理员(笔记汇总目录)
本节课涉及到的视频链接:
涉及到论坛上的知识帖:暂无
主讲老师:金蝶云星空技术系统部-彭兴老师(老师社区账号ocreanking_peng)
课程简介:介绍金蝶云星空运维最佳实践,帮助学员快速掌握金蝶云星空基础运维核心能力,确保系统持续稳定健康运行。
课程目标:
了解金蝶云星空运维核心知识
提高运维系统能力
课程收益:
降低企业出现性能问题的可能
触使项目快速落地,系统持续稳定运行
提高客户对系统性能表现的满意度
课程互动:
我们经常会遇到下面的问题
硬件配置不错,但性能表现不符合预期
机器还有很多资源没有使用
某些客户端频繁出现502问题
使用过程中,系统突然闪退了
内存很大,但是用很少
……
原因
某个硬件配置太低
选择不合适的操作系统或者数据库系统(比如选了32位操作系统,CPU超过4C性能跟不上)
网络质量不可靠
内存不够
参数设置不合理
……
课程总结:待定
课后思考题:待定
系统运维需要有一个好的基础,项目上线前做好资源估算和预留。
初始化系统基本优化的参数已设置,定义合适的自动优化脚本。
系统使用过程做好持续的优化和监控,有专职有经验的系统管理员。
1.安装环境
1.1部署环境基本要求
硬件要求:
X86架构
64位
SSD(数据库服务器推荐),SAS(应用服务器可选择):RAID1,5,10?
交换机
中高端存储设备
网线
高主频CPU
机房供电:配置UPS的电源,避免突然断电导致数据库软件突然断电,内存里面的数据未及时写入
软件要求(考虑CPU数目支持,内存支持):
Windows:64位,Windows 2008 R2企业版后的版本
Oracle:64位,11.2.0.4+psu,12.1.0.2+psu Linux内核操作系统(专门针对Oracle定制的Linux操作系统),IC部署高可用
SQL Server:拥有CPU核心数目的授权(如果只支持40核、但是电脑为64核的,就有24核性能未用到)
如使用always on等企业特性,需要采用企业版
内存超过128GB,需要采用企业版(标准版只允许在128GB以内,所以超过需要用企业版)
不要选择
Solaris:已经不再支持,CPU支持存在问题
Aix:性能表现不理想,CPU支持存在问题
Windows 2008 R2标段版,内存限制为32GB
SQL Server 2008 R2标准版,内存限制为128GB
碰到问题
应用内存无法超过32GB,原因:使用Windows 2008
CPU很多,但用不上(使用转换箱规模限制查询),原因:
Oracle数据库服务器选择Solaris,Aix操作系统
SQL Server没有足够的授权
基本要求
线下环境数据库强烈建议不要放在虚拟机里面
虚拟环境可能没有最优化
没有构建高可用和做灾备
性能比直接部署物理机差
逻辑错误,无法发现,导致SQL Server备份文件故障以及当前数据文件故障后,无法还原数据库,只能补录数据。
修复SQLSERVER 数据库一致性错误与分配错误_tianlianchao1982的专栏-CSDN博客_sqlserver 一致性错误 原因
1.2应用服务器资源查看与监控
1.3数据库服务器资源查看与监控
如果是应用服务器和数据库服务器一同部署的话就要考虑:服务器总共64GB,数据库服务器设置32-40GB。
避免内存争用情况。
参数做什么用的呢?bak备份文件是经过压缩备份出来的,减少空间占用。
校验和,备份时校验和值,避免压缩不可用。
1.4网络资源查看与监控
耗损越低越高、速度越高越好
检测请求的耗时情况
【演示】网络命令使用tcping、netstat、ping、tracert、telnet
比如应用服务器需要访问数据库应用服务器。
演示:Fiddler
演示:Wireshark(网络嗅探工具)
比Fiddler工具更全面的抓包工具
使用方法:wireshark抓包分析——TCP/IP协议_网易数帆社区博客-CSDN博客_抓包分析
案例:网络优化
案例:客户某单据新增中超过6行分录后,通过F7选择资料,携带返回时有停顿现象;查询慢,大概在5秒左右
问题分析:由于在前5行的表现尚可,所以在携带返回时取数的时间不存在问题,检查客户端的网络表现情况。做新增行的测试,用wireshark抓包。可以看到新增行的操作,出现了4次POST,ipv4的Checksum出现了14次校验失败的情况,我们认为是由于网卡设置导致的问题。
2.部署模型
声明
硬件要求管理中心可以支持故障转移,但需要购买管理中心高可用特性(使用haproxy加keepalived部署)
管理中心需要访问外网,以便于进行注册用户许可同步
金蝶云星空使用的会话是有状态的
部署集群需要设置会话保持,客户端使用网络禁止分块传输
2.1简单部署
适用场景:适用小并发场景,对高可用无需求,可允许应用服务器出现宕机。
2.2分布式部署
适用场景:适合400以下并发场景
对成本计算、MRP计算、出入库核算数据量大时,部署计算服务器
2.3集群部署
适用场景:
高并发部署,应用服务器集群,通过代理服务器实现(Haproxy或者F5 BIG IP)
数据库负载均衡:
Oracle:RAC
SQLServer:AlwayOn或者镜像
数据库读写分离:
Oracle:RAC
SQLServer:事务复制,配置查询库
需要独立交换机(万兆)
2.4网络
3.应用服务器运维与优化
3.1应用程序池
队列长度:如果并发数目非常高,客户端出现503提示,可以增加该值
启用32位应用程序=false,不要修改,IIS将以32位方式运行,内存将受限于4GB
回收
发生配置更改时禁用回收:为何修改某个配置后IIS重启?
固定时间间隔
多长时间后,IIS将会自动回收
为何前端每隔一段时间,出现闪退?
1740大多数情况下并不合适
特定时间
指定某个时间点自动进行回收
选择系统空闲或者维护期间进行
禁用重叠回收
如果为true,将会是在所有工作进程退出后方能进行回收。
如果系统出现问题时,可能某个进程无法正常退出,那应用程序池将无法回收,所以不建议设置为true
进程孤立:生产环境设置为false,调试时可以设置为true
闲置超时:
如果应用程序池超过20分钟,将会执行空闲超时选择的操作
设置为0,将不会关闭
空闲超时操作:终止、挂起
最大工作进程数:=1,不要修改,系统不支持多个进程
快速故障防护:已启用=False
3.2站点设置
3.3日志
3.4优化案例分享
4.数据库运维与优化
4.0数据库如何选项?选SQL Server还是Oracle?
到底是选SQL Server还是Oracle?
有Oracle运维背景的建议优先选Oracle。
4.1SQL Server数据库优化
SQL Server死锁资源的查看 (kingdee.com)
如何抓取SQL Server死锁信息 (kingdee.com)
4.2优化案例分享
单据列上有是否类型的字段,如单据上有显示0/1类型的空间
减少每页显示的行,控制在200条
4.3系统运行监控SQL
5.产品升级
升级预测试、升级前检查、备份数据中心
相关操作可见之前的文章:【熊说星空认证】系统管理员:环境升级与补丁安装 (kingdee.com)
【熊说星空认证】系统管理员:私有云运维与性能优化
本文2024-09-16 17:19:06发表“云星空知识”栏目。
本文链接:https://wenku.my7c.com/article/kingdee-k3cloud-14926.html