了解最新公司动态及行业资讯
简要分析是因为我们通常会一遍遍地做一件事,形成瘫痪。同样的,大部分 IT 运维都是重复性的操作和任务,是必要的。
以人工操作代替人工操作,可以有效防止低级错误的发生。这对于企业级复杂系统至关重要,可以显着提高可靠性,减少运维人员繁琐的手动工作。
运维工作是一项非常有趣的工作。这不是一种依赖很多人的工作。运维工作对人员的技能要求还是比较高的。
任何问题的处理都不能依赖人来解决。这些方法不一定能解决问题,一定会降低运维成本。
运维是一项对精细化要求很高的工作,那么什么是精细化管理?引用官方解释:
“精细化管理是一种起源于发达国家的企业管理理念。是现代管理社会分工细化、服务质量细化的必然要求。它建立在常规管理的基础上,是一种以尽量减少管理占用的资源,增加管理成本为主要目标的管理方法。
今天的IT运维已经进入精细化管理时代,而不是之前的大锅饭时代。分工明确,注重细节、流程、质量。
通过技术手段收集所有信息,管理员可以随时了解系统当前的运行状态。从而提高运维管理的整体水平和效能,实现灵活弹性的扩展能力。
运维是一项需要高度责任感的工作。各行各业对责任的要求很高,运维也是。
由于不同系统的应用层次不同,影响范围也会不同。如果运维人员因疏忽导致业务系统崩溃,影响可能是灾难性的。比如建设银行的结算系统,股票的交易系统等等。
我觉得一个运维人员可能技术没那么老练,做事也可能没那么敏捷,必须有很强的责任心,否则一切归零。
运维方法探讨
随着信息技术的发展和企业业务的不断扩展,运维人员面临的系统架构越来越复杂,关联程度也越来越密切。从技术上讲,对运维人员的要求会越来越高,都需要是精通业务系统的强兵大将。
今天的运维不再是N年前的被动运维。运维人员需要快速转变观念,学会通过积极的运维方式处理复杂多变的IT问题,保证业务系统的稳定性。需要多站在客户的角度去思考问题,解决问题。
其实每个人都有不同的经历和责任,所以对运维的理解也会不同。我们可以说运维高大上,也可以说运维稀疏、平常、平易近人。
精密和精密在于在运维上使用了很多特殊的技术,在没有业务系统感知的情况下实现业务的变更和升级。最终用户可以在没有感知的情况下继续进行自己的支付操作、游戏操作等。
稀疏通常意味着用户每天都有机会与运维人员打交道,或多或少,或多或少,都会有不同程度的交集。总有一天会和运维人员一样,抱怨不来下班。
以下是我总结的一些不规范运维经验和运维方法。如前所述,不同的人会有不同的看法,不同的经历会碰撞出不同的火花。欢迎运维爱好者一起讨论,一起拍砖。
结合自己多年的经验,总结了一些运维经验。希望能吸引更多的爱好者甚至专家来教我,让我不断的进步。以下方法主要分为五类:文档、流程、技术、监控和备份。
图 1 - 概述
文档
俗话说,兵马未动,粮草先行;一个好的系统或项目必须有大量的文档支持。
例如,在系统建设的前期,要做好系统需求文档、设计文档、实现文档等工作。在系统建设中,应根据以往文件进行实施和设计,并生成系统相关问题总结文件和更新实施文件。系统搭建完成后,应根据系统的业务能力和使用对象编写操作指南和运维指南。
部分商家在发货过程中未按要求提供相关文件。系统上线后,问题层出不穷,导致运维人员手忙脚乱,不知从何下手,往往让运维人员走了很多弯路。错失良机。
文件种类繁多,如配置文件、实施文件、设计文件、系统规范文件、项目管理文件等。由于各种原因,要求运维人员具备相应的文档编制和组织能力。同时,必须严格按照前期文件执行。有问题一定要学会及时沟通,把改正的问题更新到文档中。
以往对文档的管理大多放在用户本地,中间点放在共享的NFS或FTP中。
但是,很多功能受限于技术,无法满足高效、敏捷、交互的要求。通过知识库的文档管理功能,除了解决上述问题外,还可以将不同运维人员的经验和知识转化为生产力和协同工作。类似的软件如Wiki等。
过程
俗话说,没有规则就没有规则;随着IT环境的不断扩大和业务变化的频率越来越高,运维人员需要按照既定的规则工作,而不是完全按照业务来工作。要求,被折腾,拆东墙补西墙,虽然业务人员和运维人员的侧重点不同,职责也不同。此规则称为进程。
IT 行业最著名和最实用的流程是美国政府机构 CCTA 在 1980 年代后期开发的 ITIL(ITIL, )。
其实目前由美国商务部OGC(of)管理,版本也从之前的V1变成了现在的V3。
ITIL 为企业的 IT 服务管理实践提供了客观、严格和可量化的标准和规范。
这次不打算详细讲ITIL的内容。有兴趣的同学可以百度一下,仔细阅读ITIL。一定会让你受益匪浅,尤其是运维人员。
图2-ITIL环图
在整个系统的运维过程中,流程从头到尾贯穿整个环节。是对运维人员的保证,也是对所做的变更合规可控的保证。合理的流程设置,既可以节省运维成本,又可以促进事物的有序进行,达到预期的效果。
如何制定符合实际需要的流程?仁者见仁,智者见智。我把整个过程分为三个阶段:
1、怎么办?
也就是说,在这个过程中应该完成哪些任务,目标是什么。它不能是一项或唯一的任务,也不能是多项任务。例如,安装软件、更改配置、发布程序等。
2、谁来做?
也就是说,为了完成这个任务,需要谁参与任何部门。请记住,流程必须由人来执行,否则将是一句空话。
3、多长时间?
一个过程必须有一个从开始到结束的时间约束,即该过程需要多长时间才能完成。通常,这往往与业务系统的 SLA 有关。如果不符合要求,可能会被扣钱,不好玩。事实上,这个过程并不固定。随着IT业务和人员的变化,需要学习优化和改进流程,以适应最新的IT环境和业务需求。
技术
俗话说,欲做好事,先利其器;现在是知识爆炸的时代,想要获取知识只需要打开浏览器。
不像以前经常出入图书馆,我记得我以前去新华书城(主要是可以坐下来慢慢看书,但也可以抄出来),暴露我的年龄!
如今,很多企业都在强化以客户服务为中心,以专业技术为动力的理念,可见拥有优秀技术的重要性。
这里所说的技术,我主要想从两个方面入手,一是指人员自己掌握的技能,二是指对主流技术的分析和实践能力。
运维的技术要求还是很高的,并不是每个人都能做运维的。
首先,运维人员必须对自己所负责的系统有深入的了解,并全程参与系统的设计、实施和运维。
俗话说,你要对自己狠一点。正如著名的童话故事所说,每个仙女人物都会有一个看家本领,比如乔峰的“十八掌降龙”,段宇的“六脉神剑”。
运维人员也是如此,必须有相关领域的技术积累和丰富的设计或故障排除经验。同时,要有比较敏感的技术意识。我不敢说你需要精通十八般武功,还必须对相关的辅助技能有一点了解。这就是所谓的硬实力。
只有硬技能只能证明你能解决系统的硬问题,并没有更好的解决问题的能力。许多重大问题几乎都与外部系统有关,甚至与外部系统密切相关。
此时纯技术能力难以解决,运维人员需要具备以下软实力:
1、我认为首先要有沟通技巧;
我记得刚开始工作时,我们部门的技术人员被称为“愚蠢,愚蠢和顽固”。他们脑子里只有代码和命令,所有浪漫的情况和复杂性都成功地将我们过滤掉了。
随着难度的增加和坑的踩踏,我意识到沟通的重要性。良好的沟通可以快速与多个部门合作,了解你们的共同点和痛点,对症下药更快地解决问题。
2、合作态度很重要;
这么多年了,我还是觉得团战比诱敌要好得多,效率也高。
尤其是现在很多公司都有分支机构,IT运维人员经常分散。只有保持总部和分支机构员工之间的合作态度,才能高效、快速地发现和解决问题。
3、同理心让沟通更有效;
很多人认为同理心是企业用户体验部门的技能。事实上,随着互联网技术的发展,IT与业务的紧密结合,运维人员尤其需要感同身受。
运维人员接到故障报告或通知时,要及时与客户沟通,站在客户的角度了解问题,解决问题,防止不必要的投诉和投诉,改善运维满意度。
4、好文案的基础
无论是系统还是项目,都离不开文档从孵化到交付的支持。运维人员应具备良好的文档撰写能力,能够清晰地描述系统设计,清晰地描述问题,并保持清晰的解决方案。
如果运维人员每天都跑到机房,那肯定有问题。大部分时间应该花在学习、探索、自我提升、总结问题和防止二次发生上。这些都需要文档和支持。
5、认真做事的心态
认真做事的心态是任何行业普遍使用的良好模板。记得有一本书里说过“做事的心态决定你的身高”。对于运维人员来说,一定要热爱自己的工作。不爱,绝对不会认真去做。
这不是口号,而是一种以结果为导向、永无止境的精神。有些运维问题是由某个细节决定的。唯有认真,才能从混乱中找到线索,解决问题。
主流技术:
运维人员必须熟悉当今的主流技术(云估计、边缘估计、大数据、AIops、人工智能、深度学习等),与时俱进。经常参与线上或线下相关的讨论和交流学习。
了解当前流行的IT技术,学习它,思考如何在企业的业务中使用它,为企业创造价值,提高运维效率。因此,捕捉主流技术的能力也是运维人员的选修课之一。
监控
俗话说,与其后悔过去,不如防患于未然。监控的目的是防患于未然。
通过监控,运维人员可以及时了解企业网络的运行状态。一旦发生安全风险it运维,可以提前预警或以其他方式通知运维人员,让运维人员有时间处理和解决问题。 ,不影响业务系统的正常使用,把所有问题的症结都抹杀在摇篮里。
有多种形式的监控和更多的软件。如何选择监控对象,设计监控指标,需要运维人员根据不同业务的实际情况进行实践。
但是必须记住,现在的监控工具在触发监控指标时it运维,可以手动修复一些故障,最多只能帮你做一些简单的手动任务。更高级的手动任务需要运维人员具备深厚的脚本和系统知识。
所以监控作为运维人员的耳朵,要时刻保持12点精神。运维人员要定期“呵护”监控系统,防止“视觉疲劳”,影响监控效果。
备份
俗话说,天有不测风云,人祸有福。备份是一种安全机制。平时不用,不过是大事。
备份可以说是运维人员的最后一根稻草。如果你用好这最后一根稻草,你就可以起死回生。不好好利用,会死无葬身之地。
虽然一点也不夸张,但公司把重资产托付给运维,就是对运维的信任。运维人员自然是对那些资产和数据负责,对公司负责,这也是运维的价值所在。一种表现形式。
如今,国内外备份软件众多,因此选择一款适合自己业务需求的备份软件非常重要。
并非所有数据都需要备份。首先,明确哪些数据需要备份,确定备份范围。制定好的备份策略。不同的数据需要不同的策略设置。
选择可靠的备份介质,是选择磁带、硬盘还是光介质等,都需要运维人员根据业务需要制定。
总结
以上是我六年运维经验的一个小总结。一天不可能说很多内容,也不可能全部写完。虽然很多运维方面的事情都是靠自己的感觉和直觉来的。
在运维方法一章中,我只总结了我运维使用的一些主要方法,不涉及具体技术。
可能有同学会问,为什么现在流行的CMDB、可视化运维、ITSM等没有重点突出。虽然这些只是工具,但运维工具让运维更加透明,运维人员更轻松,管理者更放心。在实际工作中,您可以根据需要自行购买或开发,以满足业务需求。
最后,在运维方面和同学们分享,“运维是一项细致的工作,不允许有马虎的工作。运维人员必须充满创新精神和工作热情。”有了这种东西,相信你一定是一名优秀的运维人员。”
最后,祝愿做运维的同学们在运维的道路上越走越宽,技术越上一层楼。也希望自己在未来的工作学校能学到更多,与大家分享更多。
注:本文经陌陌公众号授权转载。
作者:张志强,从事信息技术服务与管理,在云估算、虚拟化架构设计、企业信息化建设、自动化运维等方面拥有多年经验。精通X86、电源、存储、虚拟化等硬件设备的调优和配置。他在混合元架构和管理、信息安全和网络架构的设计和运营方面拥有丰富的经验。
想让您的运维工作更上一层楼吗?沟通是提高战斗力的好方法。 GOPS全球运维大会2018成都站,一场运维工程师常聚的盛宴!倒计时最后 10 天,
点击视频⬇️·上海站花絮