行业动态

了解最新公司动态及行业资讯

当前位置:首页>新闻中心>行业动态
全部 4048 公司动态 912 行业动态 3136

【IT168评论】国内IT运维还处于救火队员的初级阶段,天天疲于奔命

时间:2022-09-16   访问量:1879

【IT168点评】目前,国内IT运维仍处于消防初级阶段。除了肮脏的工作,这是很累的工作,而且每天都很累。什么样的网络中断、应用卡顿、响应速度慢、服务器宕机、各种突发故障都可能导致业务交易失败,查找系统运行日志特别费时费力。维吾尔族人员急忙转身。作为运维工程师,你有没有遇到过非常辛苦的经历?社区内的网友们一直在喊叫,个个都在诉说着自己的伤心往事。 ()

回忆刚加入公司时的情景,“刚加入平台的时候,有很多问题等着我去处理,DMZ被ARP攻击,所有服务器无法正常通信。平台每三五点就有问题,客服态度很好,半夜给我打电话,还好大部分问题都可以远程处理,不然每次都要跑公司,就差一点了辛苦了。那天晚上我不用睡觉了。今年的五一是我一生中最难熬的时候。,休息三天,两天半夜被吵醒,还得跑公司人一晚上。后来,我试图查杀服务器上的ARP病毒,但是该软件将业务程序作为木马杀死,天哪!我在想我是否要在试用期之前被解雇。幸好发现有备份程序,我复制了备份程序,启动它,就可以了凯德我心情好多了。还有一次,公司的平台网站突然不能访问了。后来经过各种排查,发现公网IP被屏蔽了。我问中国电信。原因是国内IP使用了国外域名。国内IP必须使用国内域名,域名需要备案后才能使用。解封 IP 还要一个月,所以我和开发者加班加点把平台迁移到亚马逊。”

经过三年的运维,我遇到了很多困难,但既然做了这件事,我就必须认真对待。他说,“我咬了几次牙,坚持了下来。我既然做运维,也是一个重点行业的运维,管理着单位的几个核心系统,必须24天开机。”小时,30秒内接听,30分钟内接听,30天内到达现场,单位每周末晚上8点黄金时间打个电话,看我们的电话是否畅通。一个月接不到3次电话,我们就会被炒鱿鱼。外包很差。

说说我遇到过的最苦涩最无奈的案例。作为一个底层的硬件运维工程师,难免会被应用运维欺负,因为他们发现应用和业务有点慢或者真的有问题。如果有问题,他们指责它是硬件和网络问题,所以让我们检查一下。曾经,业务对FTP业务的反应太慢了。让我们检查一下原因。我们检查了各个方面,没有发现任何问题。业务方面不得不让我们检查。更换了备件,CPU,电源,主板,主机起来了,生意也活不下去了。后来换了整机。是的,整机,业务还是死机,然后业务迁移到另一台主机上,业务还是上来的。不,我们已经觉得没必要说什么了,而且已经证明和硬件没有关系,但是人们仍然不承认FTP有问题。以上所有工作都是在下午 6 点到凌晨 3 点之间完成的。因为以上证明硬件没有问题,所以必须按规定更换整机。我们想,虽然现在FTP还没有启动(凌晨3:00),但业务方并不着急,想快点更换整机。后来领导怕麻烦,就先动手吧。我把它擦掉了。以后换业务会比较麻烦。我又申请停业了,又写了实施方案。我说服了领导。后来快4点了,其他主机又开始营业了,我们就陆续回家了。但早上8:00,突然接到电话,说要赶紧赶到现场,换成整机。 CNM!”

从事运维工作5年多的双十一也在吐槽:“每天不去救火的路上,你就是在救火。想一想,很辛苦了,24小时待命,只能在家附近放假。四处闲逛,最激动的就是数据库里的数据丢失了,公司大老板惊慌了。更难没有备份。当时我想死啊~~我们公司也很重视双十一,但是我们对上线的架构做了一些前瞻性的规划,比如比如流量控制,部署ESB消息队列,服务降级,合理调整批处理计划。为了避开各个电商支付请求的业务高峰~所以双十一的加班就是在睡觉。如果有的话问题,监控组的同事ca n 去休息室喊~ 最大的问题是单笔交易。某个高峰的时候交易时间稍微长一些,也没有core crash()之类太刺激的东西,对于运维工具,我感觉比较定制,毕竟每个公司的业务不一样,当然对于一些基本的需要的话,还是可以通过一些开源工具来解决的,比如cacti,等等。我觉得监控应该不仅仅是监控基础资源,更多的应该是监控业务,比如监控业务流程,每个人的响应时间业务等等。只有这样才能把运维工作做的更好~就这些了。其实还有很多细节是我们运维工程师需要掌握的,比如你负责的系统最大容量,存储IOPS多少会成为瓶颈或者影响业务的性能,是否可根据业务发展等顺利进行线上扩容。”

更震撼的是一位运维工程师离开我们的故事,“我记得我负责之前公司的门户架构的设计和实现,然后我和导演不爽,他紧急招了几个系统工程师和一个dba接替我的工作,一步步把db、媒体资产和负载均衡设备从我的工作中分离出来~我记得当时的数据库管理员刚入职行业,而且我也没有做运维工作~他来的第二天,主任就让他投产了,结果三个生产数据库集群中的两个都被关闭了,最后我晚上打车到机房通过linux救援模式恢复,系统参数恢复到环境正常运行,还有一次重启了其中一个db但没有告诉我重启化。结果,应用程序有时可以被访问,有时访问超时。导演坚持说我的web集群配置有问题。我当时就想起来了。我从晚上 8 点或 9 点到凌晨 2 点收到它。已经快凌晨3点了。 dba把我拉下来,悄悄告诉我他昨天下班后重启了db,并没有告诉我重启web服务。什么生产会出现这种问题,最后通过重启所有的web集群解决了。正是这次生产事故让我意识到是时候离开这里了。当然,我没有应dba的要求告诉任何人这件事。我觉得现在找工作不容易,没必要让别人丢了工作。其实我这里想表达的要点如下:

文章一、作为运维人员,你必须对生产系统保持敬畏,对你正在执行的命令有深刻的理解;

二、公司就像一个营地,我们只是一个士兵,我们不必为别人的错误买单~如果不是你的问题,就大胆说吧。既然是屌丝,那我们在工作中向谁示弱呢~~

第一家三、公司是我们的父母,当然要感恩。当然,每家公司都有其不尽人意的地方。是时候离开了。 ~ 但走之前保持你的风度

文章四、即使这家公司的领导是个混蛋,他仍然是你的领导。就算他不把重任交给你,没能找到你的亮点,至少请尊重他的立场,否则你会喜欢我,我会输得一塌糊涂~我付出了太多,但我无法分享公司从成立到发展壮大所带来的丰厚回报。记住永远不要与领导作对,即使你掌握了它。如果你拥有公司所有的技术,不要自以为是。暂时不可替代并不意味着永远不可替代。作为领导者,杀一个人太容易了,否则他就不是领导者,所以你至少应该时刻对领导者假装谦虚。有礼貌~这样你会感觉像水里的鸭子。 "

从入职时的初级运维工程师到转业时的高级运维工程师,他们在企业中扮演着怎样的角色?谈到前景,有人高兴,有人悲伤!

确实表现出一种不慌不忙的风范。”工作之余,他目光远大,在紧急救灾救灾中,通常要做好计划和监控it运维外包,以减少突发事件的发生。当突发事件发生时发生时,需要果断的判断力和技巧。处理能力。”

说白了,“运维工程师在业务正常的时候就是闲人,偶尔需要发布和部署新平台,出现问题就得赶紧解决问题,因为越多时间越长,能力越差,老大。心情不好就会被炒鱿鱼。因此,运维工程师在企业中起着举足轻重的作用。维修工程师能力不错,但是在老大眼里,他可能觉得自己花钱买了个闲人,看不出你怎么稳定一个经常出问题的平台,操作种类很多,一个大公司有专门的运维部门,有的负责业务运维,有的负责网络运维,也有负责硬件运维的维护和开发运维。

我非常看好运维工程师的职业前景。其实,辛苦是低级的运维。当你成为高级运维、运维主管、运维经理、运维总监后,你会发现,越往上走的越少,越不需要半夜起床处理,至少对于普通的事情。 “

但他的脸色却是平静的:“a.运维工程师应该在企业中扮演管家的角色,至少要保证企业系统(硬件和软件)的日常正常运行,并且在同时可以对企业信息化建设进行前瞻性规划和运营(购买硬件/引入各种系统/提出系统集成等),能够充当系统开发者和用户之间的桥梁和润滑剂(操作的好处是系统用户比系统用户更懂开发,员工更懂系统)

b.对其他行业不熟悉,但是在旅游行业,由于业务比较复杂,但是从业者的进入门槛低,所以业务系统的开发者一直在抱怨用户愚蠢/懒惰/乱操作等。 ,我也从同行那里了解到,基本上每个旅行社都是这样,每个旅行社的系统使用深度基本上都很浅。他们只使用信息录入和同步的功能,深入的流程监管基本上不是几家公司能做到的。差异往往是因为运维团队跟不上,不能起到桥梁的作用

c。运维团队所知道的最专业的就是顺丰。据用友小伙伴介绍,顺丰运维团队在对接用友开发团队时,已经第一时间准备好所有材料。 ,甚至一些用友用户都没有注意到;

d。我觉得运维工程师的职业前景会越来越重要,因为随着企业信息化越来越普及和深入,对运维工程师的要求也会越来越高。值类型也会越来越突出;”

正经话,为运维工程师喝彩,“我之前和一个EMC老工程师聊过一个公司裁员的事情,他说如果一个公司达到了运维裁员的程度it运维外包,那么这个公司快要死了,好的运维工程师确实能把系统维护得很好,不是因为工程师解决各种疑难故障的能力高,而是因为他们有良好的运维习惯,比如详细记录各种变化再小,应先应用,再操作,最后记录,便于日后故障排查。

目前只有非常大的公司才会重视运维人员。其他公司把运维人员当做苦力,待遇不高。他们不怕人员流失。你可以走了。您可以在离开之前与其他人清除情况。这种公司不明白,不管怎么交接,新维护人员熟悉系统需要一段时间,交接过程中容易漏掉问题。久而久之,遗留的问题会越来越多,以后问题爆发的时候就很难处理了。

我建议,如果你做运维,尽量去一些大公司和专业公司,这样你接触到的知识和流程更专业,更规范,有利于以后发展。正所谓近朱为红。 "

台上一分钟,台下十年。有没有什么“万能”的工具可以解救运维人员的痛苦?大家已经开始提建议了。最受关注的是监控工具,其次是帮助文档。

:“监控还是比较大的,用cacti,然后就是ssh客户端putty,上传下载等Linux工具,还有性能和进程查看命令,mysql相关命令集等。”

:“最常用的工具自然是SSH工具。我个人比较喜欢用它,因为它可以和xftp一起使用,而且好用。另外,这个工具的优点是它不需要公共网络IP。建立远程桌面连接。有了这个工具,我可以在家里远程处理问题,而且这个软件还有一个移动客户端。当我在外面玩的时候,我也可以远程解决平台上的小问题,因为我通常不会出门不用带笔记本电脑,而且很难找到电脑来处理,所以用这个工具还是蛮方便的。

还有一个远程桌面工具RD,它是微软开发的一款移动客户端软件。它可用于从手机连接到服务器。因为习惯了,所以用的比较少。如果你管理 MYSQL,我推荐它。这是一个图形界面管理工具,非常好用。我推荐用它来监控,它帮我发现了很多问题,而且它有自己的报警功能,可以一起使用。

:“网络分析工具,比如监控软件,比如,等等。目前主要用于监控网络设备和服务器的流量和负载,准备学习。”

除了监控工具外,补充一句:“如果真的是万能工具,就是帮助文档,不管是给自己、同事还是前台用户,只要不断积累,就会变成越来越实用了,特别是团队内部的帮助文档,尽量把每一个解决思路都写出来,慢慢的你会发现大部分问题可以用几个常用的思路来解决。之前的团队甚至在我离开之前就开始了。实习生能做日常维护是因为有帮助文档,很多操作都很傻,但是这些都需要团队的不断积累。”

本话题由大华IT专栏发起。更多话题讨论详情,请点击链接:

2015第六届中国数据库技术大会(DTCC)将于4月16-18日在北京新云南皇冠假日酒店举行。将有一个关于数据库操作和维护的专题会议。大咖将为您带来最新的尖端科技。欢迎大家报名:

上一篇:it服务热线与大体上的概念是一样的

下一篇:2016年IT运维工程师工作的岗位职责范本-乐题库

发表评论:

评论记录:

未查询到任何数据!

在线咨询

点击这里给我发消息 售前咨询专员

点击这里给我发消息 售后服务专员

在线咨询

免费通话

24小时免费咨询

请输入您的联系电话,座机请加区号

免费通话

微信扫一扫

微信联系
返回顶部