了解最新公司动态及行业资讯
01人工运维&普通运维
在了解三者的区别之前,我们先明确一下两者的定义。 一般来说,运维工作的目的是保证企业业务的连续性,核心是提供高效、优质、安全的IT运维服务。
普通运维:指传统的IT运维模式,大量采用人工手段维护企业基础设施和应用运行的稳定性,基本包括日常维护、监控保障、变更发布、资源管理、运营以及维护流程、服务支持等内容。
人工操作和维护:随着现代控制理论和电子计算机的出现,“自动化”一词更多的是指将人工控制与信息处理相结合,使机器设备、系统或过程能够在无人或少人的情况下运行. 直接参与,根据人的要求,通过人工检查、信息处理、分析判断、运行控制等方式实现预期目标的过程。
手动运维更多的是针对特定的运维场景。 它去除了一线运维人员常年做的一些周期性、重复性的工作it运维技术,用人工工具或平台代替或辅助完成运维工作。 它还可以提高运维效率it运维技术,增加系统风险,促进运维组织的成熟和能力的升级。
普通运维和手动运维之间没有严格的界限定义。 人工运维是普通传统运维进化的高阶状态。 企业运维部门为何投入巨资进行运维人工升级? 问题的症结在于,传统的运维形态在运维的三个核心:效率、质量、安全上存在问题:
从近几年各行业的监管实践来看,企业IT部门的数字化水平和运维部门的工具能力建设并不能支撑或完全替代传统运维的所有工作。 完全人工运维仍然存在包括运维技术和理念、内部管理制度和工作规范等方面的制约因素,但传统运维形式向人工的逐步演进是可以预见的。
02 从普通运维升级到人工运维
2016年,互联网行业开始进入“下半场”。 “数字经济”、“云原生”、“大数据”、“人工智能”等各种概念层出不穷。 传统行业,尤其是金融、能源、政府单位,也开始涉足数字化转型。 在大潮中,从业务端数字化到O2O,从传统开发架构到云原生,最终,奥美也主动或被迫迎来了自己的数字化转型。 其中,人工运维是数字化转型中的热点话题之一。
2017-2020年,是各企业单位开展各类人工运维项目最活跃的时期。 但是,在项目实施后的一段时间内,企业会逐渐发现运维中仍然存在着各种问题,比如各工具相对独立,未能实现联动,工具扩展性能差,无人维护等。维护开源工具漏洞和 IT 配置数据。 究竟等等,本来的目的是为了使用手动工具来提高运维效率,没想到却阻碍了运维效率的提升。
五年来,不少企业纷纷开始“返工”,选择重新练好“基本功”。 要想实现从普通运维到人工运维的升级,必须先准备好以下基本技能,否则人工运维只会昙花一现,难以持续支撑运维工作,更不用说提高运维工作效率和保障业务数字化转型。
那么在实现人工运维之前,企业应该做哪些基础工作呢?
运维数字化转型依次遵循“对象数字化”、“行为数字化”、“操作数字化”的形式,是目前最好的演进路径。 具体来说,建议企业在数字化转型或运维升级过程中,首先使用CMDB作为企业IT架构数字化描述的基础。 数字化,进而实现其可观察性,通过不同场景下运营和服务行为的数字化和人工运维来保证业务的连续性和敏捷性。 只有在此基础上,才有可能实现运维的最终目标——构建企业级的技术运营体系,全面支撑企业数字化的成功。
值得一提的是,并非所有企业都必须严格按照上述路径提升运维水平。 建议企业可根据自身实际情况搭建统一的运维平台。 一方面,对于现有的工具,可以尽可能的进行整合,充分利用旧的,另一方面,可以补充和加强缺失的能力。
03 实行人工运维
首先,企业在前期建立了比较扎实的基础,比如比较完善的配置管理系统、监控告警系统、运维流程管理平台等。 那么考虑人工运维施工会更加合理,从而避免返工或重复施工。 ,落地的疗效和形成的利润会更加明显。 人工运维的实施应该分为以下几个步骤:
1)评估企业运维发展阶段
企业可以对目前内部运维工具进行整理整理,尤其是手工工具的构建,是否具备脚本/命令批量执行、文件下发和数据采集的能力,是否具备包括定时在内的作业执行能力、API调用和作业调度,是否有跨区域的平台基础,评估现有人员的配置和能力。 最简单的形式如右图所示,它决定了企业目前人工运维成熟度的阶段。
2)搭建统一的人工运维平台
组织团队负责人工基础平台的建设,各IT部门和机构根据需要在平台上开发SaaS工具。 既能充分发挥多方积极性,又能产生良好的协同效应,既有个体需求,又有团队共性。 但同时,也对平台本身的建设提出了极高的挑战。 平台需要能够提供统一架构、统一认证、统一调用、统一接入等能力,实现人工工具的敏捷快速迭代。
这意味着人工运维平台的能力层(PaaS)需要对原有的运维能力进行拆分,将共性能力沉淀,生成管控平台、运营平台、标准运维、等,通过统一的 API可以对接外部系统和第三方工具(iPaaS),拥有基于PaaS的开发框架,针对不同的运维场景开发运维工具(aPaaS)。 这样所有基于运维平台开发的手工工具都可以在平台上实现自然交互和联动,形成真正统一的手工运维平台。
3)梳理企业现有运维流程
大部分运维流程会同时涉及各种操作执行流程和审批流程,因此需要提前梳理各种运维流程。 比如在金融行业,会有特别严格的运维流程要求。 将参照ITIL、ITSS等标准进行建设。 对于既定的流程,需要梳理哪些环节,可以通过人工的方式进行替代或辅助,确保所涉及的流程节点尽可能在线化、自动化、标准化,提高整个流程的效率。
4)在运维平台上不断建立人工运维场景
通过OASR(--tool-)模型详细分析运维场景,首先明确针对哪些运维对象、应用系统和基础设施; 其次,在现有的运维组织架构中,人员构成是怎样的,对于那些运维对象,可以使用什么样的运维工具; 最后对运维操作进行编排和执行,生成人工运维场景。 这样梳理出的场景有很多,核心场景包括日常运维任务、应用发布、容灾切换、资源交付等人工场景。
04嘉威蓝鲸人工运维解决方案
针对不同的运维场景,嘉维为蓝鲸提供了一系列的人工运维解决方案。 提升人工运维的关键在于IT对象执行能力与场景创建的融合。 为实现ITOM集成系统的手动化,全面覆盖运维工作,需要在执行能力集成和运维原子化的基础上,完成跨IT对象的执行编排和调度。维护能力,从单对象手动突破到发布和灾难。 、应用检查等复合场景重建。
下面给出三种常见的人工运维场景(人工应用发布、人工灾备切换、人工巡检),后续将继续拓展其他人工运维场景。
申请背景:
应用架构不断更新,用户需求急剧增加,应用数量呈指数级下降,发布迭代速度越来越快。 应用运维保障应用的稳定运行。 还需要同时响应开发和业务需求,完成版本变更或在线交付,并为业务、运维、测试等外部人员提供相关服务。
产品能力:
嘉微蓝鲸应用发布中心支持单体、SOA、微服务、容器化应用的发布和管理; 支持发布程序包、配置文件及其实例化、SQL包、模板集(文件); 支持多应用、多实例、多环境、多集群发布; 支持定时、并行、滚动、批量发布、蓝绿发布、灰度发布等多种形式; 可快速发布或回滚,具有灵活的可视化编排引擎。 帮助企业高效、快速、规范、稳定地实现人工部署。
申请背景:
企业对业务中断的容忍度越来越高,业务架构的复杂度越来越高,切换过程也越来越复杂。 企业能否顺利完成容灾切换,取决于容灾体系建设、容灾演练是否充分、容灾切换步骤是否到位。 同时,企业需要通过实际的容灾切换演练,不断优化和完善容灾方案。
产品能力:
嘉维为蓝鲸手动容灾切换提供灵活的流程编排能力,帮助企业实现应用容灾切换和恢复计划管理和人工操作,支持一键容灾切换和大屏跟踪展示,确保正常运行企业灾难恢复。 可确保备用切换活动的成功,同时促进企业的数字化转型。
申请背景:
人工巡检是将网络、服务器、服务/应用的自动巡检操作转化为人工操作的一种方式。 一般巡检工作面临以下问题:
1. 提高效率,解决海量对象如何高效操作的问题;
2、需要灵活区分并获取不同环境/场景下不同物体的检测结果;
3、企业内部网络环境复杂。 检查时需要解决网络故障问题或开启大量防火墙/网络策略。 过程繁琐,安全性不易控制。
产品能力:
嘉维蓝鲸人工巡检中心改变运维人员传统重复性自动巡检工作方式,支持用户自定义巡检脚本和巡检对象,涵盖即时性、周期性巡检场景等,实现按任务计划进行人工巡检可以简化巡检并生成标准的可视化报表,减少巡检工作量,提高巡检效率,促进运维人员轻松、全面地掌握IT对象的运行状态和潜在风险。
如果您也有手动运维相关需求,请联系我们!