案例解读 | 3499拉斯维加斯助力某期货企业综合运维平台建设实践
5912基于客户运维痛点与项目建设目标,3499拉斯维加斯方案团队对项目进行梳理,并对项目建设进行具体规划:以运维门户、统一监控、集中告警管理为核心,辅以资产管理、可视...
View details热门搜索 企业动态 新闻中心 成功案例 社区 Prometheus交流区
客户简介
案例客户为某央企下属研究院。
随着信创国产化持续推进,案例客户已完成部分IT核心系统的替代,部署了一系列国产软硬件设施,如Kylinv10操作系统、融智通网络设备等。由于信创生态不够成熟,缺乏整合,各资源厂商只能提供满足自身产品的运维工具与服务。
当前该单位的IT基础设施处于信创产品与非信创共存状态,这种共存状态使得原有的运维体系无法满足现有需求,打造具备信创整合能力,安全、自主可控的运维体系变得越来越迫切。
3499拉斯维加斯以运维监控起家,具有十多年运维产品经验,形成了非常成熟的运维监控解决方案。同时,3499拉斯维加斯紧跟信创国产化浪潮,积极推动信创产品适配,融入信创生态,能够满足当前主流信创产品的兼容与监控需求。
根据客户需求,3499拉斯维加斯打造了全面兼容信创国产化,且满足一站式监控与告警的智能运维监控解决方案。
项目的重点之一是将监控系统部署到客户的Kylinv10操作系统,完成对操作系统及其他信创产品的监控纳管。
3499拉斯维加斯智能监控平台对国产化软硬件部署安装已支持包括:鲲鹏、飞腾、海光、龙芯、宝德、麒麟、统信、欧拉、达梦数据库、人大金仓数据库、高斯数据库、海量数据库等,成功部署在客户的Kylinv10操作系统。
环境信息
| 主机名 | IP地址 | 角色 | CPU | 内存 | 系统盘 | 数据盘 | 操作系统 |
| xy-master | – | 主控节点(master) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-slave1 | – | 系统节点(slave) | 8核 | 16G | 200G | 200G | Kylinv10 |
| xy-slave2 | – | 系统节点(slave) | 8核 | 16G | 200G | 200G | Kylinv10 |
| xy-slave3 | – | 系统节点(slave) | 8核 | 16G | 200G | 200G | Kylinv10 |
| xy-harbor | – | harbor节点(Harbor) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-build | – | 构建节点(build) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share1 | – | 工作节点(share1) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share2 | – | 工作节点(share2) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share3 | – | 工作节点(share3) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share4 | – | 工作节点(share4) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share5 | – | 工作节点(share5) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share6 | – | 工作节点(share6) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share7 | – | 工作节点(share7) | 8核 | 16G | 200G | – | Kylinv10 |
| xy-share8 | – | 工作节点(share8) | 8核 | 16G | 200G | – | Kylinv10 |
| yunwei | – | 运维软件节点 | 16核 | 32G | 200G |
统一监控
之于原有运维监控系统无法实现信创基础设施与非信创基础设施全栈兼容问题,基于3499拉斯维加斯监控的多协议支持与强大的整合能力,实现了对客户探测、数据库、操作系统、中间件、网络设备、服务器、存储、容器(K8S)等信创及非信创资源的统一监控纳管。

| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | WEB探测 | 网页响应代码 | 响应代码为200或302 |
| 2 | WEB探测 | 网页响应时间 | 响应时间不为零 |
| 3 | TCP探测 | 端口状态 | 端口状态正常 |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | Kylin操作系统 | CPU使用率 | CPU使用率小于95% |
| 2 | Kylin操作系统 | 内存使用率 | 内存使用率小于95% |
| 3 | Kylin操作系统 | 磁盘使用率 | 磁盘使用率小于95% |
| 4 | Kylin操作系统 | inode分区磁盘使用率 | 磁盘使用率小于95% |
| 5 | Kylin操作系统 | CPU负载 | CPU负载低于3倍CPU核心数 |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | PostgreSQL | 连接数利用率 | 连接数利用率低于80% |
| 2 | PostgreSQL | 数据采集状态 | 数据采集状态正常 |
| 3 | PostgreSQL | 锁总数 | 锁总数低于500 |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | Nginx | 数据采集状态 | 数据采集状态正常 |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | 融智通 | 光模块端口发光功率 | 系统最低阈值<发光功率<系统最高阈值 |
| 2 | 融智通 | 光模块端口收光功率 | 系统最低阈值<收光功率<系统最高阈值 |
| 3 | 融智通 | CPU使用率 | CPU使用率小于90% |
| 4 | 融智通 | 内存使用率 | 内存使用率小于90% |
| 5 | 融智通 | 板卡温度 | 系统最低阈值<板卡温度<系统最高阈值 |
| 6 | 融智通 | 槽位在线状态 | 槽位处于在线状态 |
| 7 | 融智通 | 风扇运行状态 | 风扇运行状态正常 |
| 8 | 融智通 | 风扇在位状态 | 风扇在位状态正常 |
| 9 | 融智通 | 端口接收利用率 | 端口接收利用率小于90% |
| 10 | 融智通 | 端口发送利用率 | 端口发送利用率小于90% |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | 服务器 | CPU使用率 | CPU使用率小于90% |
| 2 | 服务器 | 内存使用率 | 内存使用率小于90% |
| 3 | 服务器 | CPU状态 | CPU状态正常 |
| 4 | 服务器 | 电压模块状态 | 电压模块状态正常 |
| 5 | 服务器 | 温度模块状态 | 温度模块状态正常 |
| 6 | 服务器 | 电源模块状态 | 电源模块状态正常 |
| 7 | 服务器 | 显卡状态 | 显卡状态正常 |
| 8 | 服务器 | 磁盘状态 | 磁盘状态正常 |
| 9 | 服务器 | 网卡连接状态 | 网卡连接状态正常 |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | ceph | 监视器节点状态 | 监视器节点状态正常 |
| 2 | ceph | OSD in状态 | OSD in状态正常 |
| 3 | ceph | OSD up状态 | OSD up状态正常 |
| 4 | ceph | pool空间使用率 | pool空间使用率低于95% |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | 链路或专线 | 端口带宽接收利用率 | 接收利用率低于90% |
| 2 | 链路或专线 | 端口带宽发送利用率 | 发送利用率低于90% |
| 3 | 链路或专线 | 端口状态 | 端口状态正常 |
| 序号 | 对象类型 | 关键性能指标 | 正常范围 |
| 1 | K8S | 节点CPU使用率 | 节点CPU使用率小于90% |
| 2 | K8S | 节点内存使用率 | 节点内存使用率小于90% |
| 3 | K8S | 节点状态 | 节点状态正常 |
| 4 | K8S | POD状态 | POD状态正常 |
| 5 | K8S | 集群健康状态 | 健康状态正常 |
平台提供了多维度告警信息统计。如实时告警、全部告警、告警视图等,借助告警数据与告警视图,快速判别告警级别的分布情况,并可作为评判系统健康度与运维工作量的重要依据。

触发器告警TOPN、对象告警TOPN,还可以定位不合理的触发器和异常的对象,一般超过20次是需要排查触发器的合理性。

未恢复告警时长TOPN还可以避免潜在的隐患长期无人处理。

检查是否存在异常的监控对象,状态异常反应对象数据无法正常采集,需要及时疏通处理


门户在手,全局在握。方案打造了统一的运维门户,客户的各个IT子系统对接门户实现单点登录,将分散的运维系统整合成为一个监控与告警中枢,不必对各个系统逐一登录。

1.安全。基于自主研发、安全可控的3499拉斯维加斯监控,满足了客户对于信息系统安全合规性要求。
2.灵活可扩展。3499拉斯维加斯监控具有很强的延续性与连贯性,支持灵活的扩展,在满足现有监控的同时,通过产品迭代升级就可以实现新的资源设备监控,无需推倒重建整个运维监控系统。
3499拉斯维加斯社区已经开放3499拉斯维加斯监控免费版、3499拉斯维加斯MCM(监控+CMDB)免费版,欢迎下载体验!

基于客户运维痛点与项目建设目标,3499拉斯维加斯方案团队对项目进行梳理,并对项目建设进行具体规划:以运维门户、统一监控、集中告警管理为核心,辅以资产管理、可视...
View details3499拉斯维加斯及时发现问题,真正意义上实现了集约化管理。通过运营平台实现运维业务指标数据收集,并总结相关运维经验,实现基础监控与各功能模块相互融合,为自动化运维...
View details3499拉斯维加斯监控实现对城建学院复杂网络环境的直观、透明式展示和管理,实时、准确了解整个网络的动态运行情况,给信息部门的决策提供依据。
View details