了解最新公司动态及行业资讯
根据百度百科的定义:运维工程师负责维护和保证整个服务的高可用,同时不断优化系统架构以提高部署效率和资源利用率,从而提高整体投资回报率。无论运维做什么,运维工程师最基本的职责就是对服务的稳定性负责,保证服务能够7*24H持续改进为用户提供的服务。
定义:IT 团队向内部和外部用户提供的所有流程和服务的超集,并由他们自己用于开展业务。
IT 运营团队的重要角色包括技术管理和质量保证以及基础设施管理,并确保 IT 产品(或服务)满足客户的所有需求和期望。运营团队以所需的质量和成本提供有效的服务。
我们主要想讨论三个话题:
1、什么是运维
2、初学者如何系统学习运维知识
3、云时代的运维
1、什么是运维
首先我们来看看目前主流招聘平台对运维工程师职位的工作内容要求和专业技能要求:
工作职责:
1、企业数据中心建设和管理相关工作,包括基础网络、信息安全、服务器、存储、备份、操作系统、数据库、中间件等基础软硬件建设、管理和优化。
2、信息系统运行保障相关工作,包括生产系统生产支持、日常运维、变更和应急处理。
3、开发测试支持相关工作,包括测试环境搭建、日常运维以及相应的技术支持。
4、内控管理相关工作,包括堡垒机等技术和产品的管理,以及流程体系的制定和实施。
工作要求:
1.熟悉虚拟化和主流linux系统和HA软件。
2.熟悉mysql等主流关系型数据库。
3.熟悉nginx、redis等软件。
4.熟练使用shell或编写日常管理脚本。
5.熟悉X86服务器、SAN存储等常用硬件设备。
6.熟悉网络知识服务器运维技术,能对常见的交换机、路由器、防火墙、IPS、WAF等设备进行简单的配置和管理。
7.熟悉常见的监控、管理和控制系统,如堡垒机等。
8.熟悉网络和应用安全相关知识和技能,能够处理基本的网络和安全问题。
可以得出结论,运维工程师的工作内容非常广泛服务器运维技术,需要及时、适当地参与到软件产品的整个生命周期中。作业需求涉及的技术栈深度较大,包括:
1、脚本语言、shell、perl 或
2、网络知识
3、分布式计算
4、应用服务器
5、数据库等中间件
6、监控系统
7、安全
那么,究竟什么是运维?我们看下图,一个软件产品(或信息系统)的交付过程,在1-5阶段,运维团队负责基础设施资源供给(计算、存储、中间件部署、安全),在第6阶段,产品和研发团队完成主要工作后,系统进入上线后运维阶段。运维团队对系统运行质量、稳定性、可靠性、安全性等指标全面负责。
在实际的运维项目中,运维团队应该关注的知识领域包括:需求变化、输入/输出、资源、策略、前瞻性、控制、计划和成本。也就是说,需要在这些要素的约束下制定。运维工作标准及相应流程。
运维部门的职能层次(发展前景)一般有以下几个层次:
a、初学者、操作系统、中间件安装部署、通用配置
b、中级工程师、应用部署与配置、系统运行监控
c、高级/专家级,运维架构设计/优化,具备综合考虑成本、效率和水平的能力
d、有团队,超前规划
2、初学者如何系统学习运维知识
一、学习和掌握Linux系统:
1、Linux基础知识、基础命令(cp、ls、file、rm、cat、ps等操作命令)
2、Linux 用户和权限基础知识
3、Linux系统进程管理
4、文本编辑命令(vim、grep、sed、find等)
5、shell 脚本
学习完以上Linux知识后,进一步了解相关知识,
1、TCP/IP 网络基础
2、Linux企业常用服务(如dns、http、ftp、mail、nfs等)
3、企业级安全原则和防范技能(系统性能监控、安全威胁模型和解决方案)
4、 加解密原理及数据安全、系统服务访问控制
5、安全策略构建
6、高级shell脚本(主要是结合一些应用,写一些案例)
7、应用php、mysql搭建CMS或个人网站系统
如:
至此,你基本可以成为入门级的运维工程师了。
3、云时代的运维
随着云计算时代的到来,业内流传着一个广为流传的“观点”:云计算将淘汰传统运维。
那么我们来讨论第二个话题,什么是云计算运维,运维工程师如何在云计算时代保持自己的专业竞争力。
云时代,运维工作发生了深刻变化。传统运维需要处理服务器、网络、存储等硬件设备。在云时代,不需要去碰硬件设备,而是去处理虚拟资源(其实虚拟化就是云平台的核心支撑技术,软件定义计算,软件定义存储,软件定义网络)。云平台厂商提供的负载均衡、动态伸缩、数据迁移等服务降低了运维的复杂度,在一定程度上降低了运维的门槛。
云计算时代的运维,通过人工智能、大数据等技术,将节省更多的人力物力成本,减轻运维人员的压力。
但是,云时代的运维也将出现新的挑战:
1、工程师不再直接操作物理资源,而是面对一堆API(云平台提供),更难发现问题。有编程经验的同学都知道,世界上没有完美的系统。
2、大型系统所涉及的资源(包括可横向扩展的弹性计算服务、PaaS平台提供的第三方服务、负载均衡、数据同步等)大大扩展,资源的增长带来关于管理复杂性的急剧增加
3、云产品本身的版本升级增加了系统运行的不稳定性
4、云平台和云产品的按需特性带来了控制成本的需求,即如果可能,运维团队应该考虑是否可以减少云资源的使用来控制成本,以及这种“缩水”无疑会给运维工作带来一定的风险。