了解最新公司动态及行业资讯
背景与挑战
信息化“十二五”以来,“三通两平台”成为教育行业信息化建设的重点。在上述背景下,各地教育部门和学校开展了大量建设实践。
随着当前教育应用创新的不断涌现和高校信息化建设从数字校园向智慧校园的转变,校园IT系统也面临着新的变化和挑战,主要包括以下两个方面:
此外,随着数字校园向智慧校园的转变,这一过程也给校园IT运维带来以下痛点:
解决方案
高校智能业务运维三个阶段包括运维工具完成阶段、IT运维管理标准化阶段、智能运维阶段。
完成高校运维工具
运维工具完成阶段主要包括完成基础设施监控、业务应用监控、用户体验监控、集中告警等校园IT基础设施监控。
此外,随着智慧校园的建设和学校IT基础设施的逐步完善,多个校园共享同一个机房的特点,使得IT基础设施的实时在线和安全性能显得尤为重要。
基于以上背景,云智能基础设施监控可以通过丰富的协议访问能力和模型定义能力快速支持新资源it运维技术,实现资源的综合监控,实时掌握服务器网络软硬件等基础设施的现状时间。健康状况,用于评估和衡量基础设施利用率,为用户基础设施优化提供准确数据,了解基础设施设备的处理能力,预测潜在故障并提供预警。
在校园机房可视化实时报警方面,云智慧提供机房3D全景,包括机柜和机柜外单台设备;温湿度采集模块采集机房区域的温湿度状态,然后连接机房的串口服务器,串口服务连接网络后,即可传输温湿度状态数据到云端智能服务器统一监控。
在指标检测方面,云智慧内置了上万个指标项,开箱即用。
云智能可以主动发现业务问题,确保各校区教学楼专线的高可用性。一方面,云智慧通过全国乃至全球节点对高校对外业务进行7*24主动拨号测试,及时发现问题,主动报警;专线质量提升用户体验。
随着校园内各种业务系统的逐步完善,业务与业务之间的调用关系逐渐复杂化,难以快速定位业务系统中的问题。基于以上因素,面对复杂多样的系统,学校业务系统需要可视化工具进行集中管理,同时量化第三方提供的业务系统质量,从而定位分析学校业务系统故障。
云智能拥有端到端的全技术栈应用性能管理,包括对移动和智能设备的支持it运维技术,以更好地了解真实的用户体验;支持端到端高度虚拟化的应用程序以跟踪负载变化;并支持跨云环境的公有云、私有云和混合云部署方法。上述表现可以快速定位教务系统存在的问题,包括以下几个方面:
在业务分析方面,云智慧可以根据唯一的请求ID自动连接整个请求,从前端到后端的应用代码和基础设施,并基于单个问题还原问题的快照请求序列,帮助高校从外向内逐步分析师生使用系统问题的根本原因,从而达到师生使用系统快速重现的目的。
云端智能高效的解决方案,可以快速定位代码级问题。包括基于业务拓扑的问题发现、移动端代码崩溃问题分析、Web端真实用户体验监测分析、请求和关键事务分析、单请求分析。
云智慧可以基于各种教育系统整合整理应用和IT资源。一方面,系统架构拓扑图分层展示了系统中所有对象的健康状况以及它们之间的依赖关系。另一方面,用户可以通过资源快速查看垂直依赖关系并分析关联对象,从而加快根因排查过程。
云智能提供报警统一导出,实现报警的集中化、自动化、多元化、智能化、人性化。主要包括以下几个方面:
高校运维管理标准化
高校运维管理标准化阶段包括ITSM、CMDB、运维自动化等技术的实现。 Cloud 通过标准化的管理流程规范第三方服务,优化师生的用户体验。
在IT服务管理(ITSM)的整体设计上,云智能数字化运营服务管理产品可以完成高校IT服务管理体系的建设。通过已有的产品功能+系统API接口+定制流程+部分功能的二次开发定制,即可满足智慧校园项目的建设内容。
在信息资产的集中管控方面,云智慧拥有基于自动发现的CMDB数据维护。通过Agent、API等多种方式自动采集Iaas、Pass、Saas层的配置项信息。支持多数据源的联合采集,协调各种数据源的采集数据,保证CMDB中配置项信息的完整性和准确性。
下图展示了CMDB的整体架构设计。通过云智能CMDB,可以完成从IaaS、PaaS到SaaS层的运维元数据的综合管理,为运维监控、服务管理、自动化等系统提供完整、准确的元数据支持。
以下是CMDB应用于监控报警处理及自动化平台的数据良性循环流程。 CMDB作为各种资源的配置信息库,提供监控告警信息的信息下钻能力,可以将单点告警信息延伸到具体的影响区域。自动化平台通过报警自愈触发系统修复。此时会通过CMDB获取任务执行的目标列表,提高了任务执行的准确性和可行性。问题系统修复后,CDBM会自动收集系统信息并更新原数据库中的信息,完成信息归档。
在信息工单可视化方面,云智慧通过工单统计,使高校信息化工作可追溯,从而达到持续优化的目的。
高校智能运维
高校智能运维包括智能分析、预测分析、机器学习、AI等技术的实现。一方面,通过实现AIOps智能运维场景,转变运维管理模式,从而提升智能化、自动化水平。另一方面,利用人工智能算法,根据数据特征感知业务隐患,根据历史数据预测故障。
云智能提供的指标异常检测旨在通过算法发现KPI(Key )时间序列中的异常点,然后通过告警通知运维人员相关风险。同时,指标异常检测也是其他AIOps场景的前置场景,检测结果为后续的告警收敛、根因定位、故障自愈等场景提供输入信息。
单指标智能异常检测如下图所示:
多指标智能根因分析如下图所示:
智能日志异常检测包括日志异常模式检测、日志统计异常检测、日志序列异常检测等异常检测。
云智能提供基于用户体验的运维思路。从数据监测,到分析优化,再到管理指导,提高了师生的整体满意度。实现了从基础、提升、管理、进阶四个阶段的转变,实现了从仪器化运维向智能化运维的演进。
落地实践 某高校统一监控平台案例 需求痛点 方案亮点 方案价值
开源的好处
云智慧有一个开源的数据可视化编排平台。通过配置数据模型,为用户提供数百个可视化图形组件,零编码即可实现满足自身业务需求的炫酷可视化大屏。同时,飞鱼还提供灵活的扩展能力,支持组件开发、自定义功能和全局事件的配置,确保复杂需求场景的高效开发和交付。
如果您喜欢我们的项目,请不要忘记点击下面的代码仓库地址并在/Gitee 仓库上点击Star,我们需要您的鼓励和支持。此外,您可以立即参与该项目贡献成为,将有超过10000元现金等着您。
地址:
Gitee地址:
微信扫描识别下方二维码,备注【飞鱼】加入AIOps社区飞鱼开发者交流群,与项目PMC面对面交流~