了解最新公司动态及行业资讯
一个拥有4万台服务器的公司,整个运维团队至少有50人
如果是自建IDC,50人中有10人会专门做机房、网络、服务器、存储等底层架构,也就是IaaS层
如果你使用公共云服务,你可以拯救这 10 个人
物理架构的 IaaS 层有 PaaS服务器运维技术,这 50 人中可能有 10 人专门从事自动化平台、发布、监控、DB 管理、容器化、虚拟化等。
上到业务层负责业务运维。可能每2、3个人负责一个比较大的垂直业务,比如微信支付、淘宝订单管理等。
那么在这2、 3个业务操作中,我通常在简历中这样描述自己
xxx业务核心运维负责人,最高并发QPS xx万,独立维护4万多台机器服务器运维技术,年可用率99%以上
那么问题来了:“这里所谓的人真的是人吗?”
借用腾讯蓝鲸的架构图说一下这个问题
从下到上,它们是 IaaS、PaaS 和 SaaS 层。一般来说,大公司的每次运维只负责其中的一小部分。有的专门做虚拟化和容器化,有的专门做监控告警,有的专门做后续业务运维业务生命周期服务
负责采购、上架、调试、拉光纤和网线的这群人,这里不算。
就像盖一座摩天大楼,大家只看到台前的建筑师,却看不到台后的施工主管
在《SRE》一书中,每个IDC都需要有专门的团队负责硬件设施和基础设施
像谷歌这样强大,拥有百万级的服务器规模,以及大量的技术专家,也需要有人做一些体力活。
现在有各种公有云,导致很多技术人员做业务应用(包括开发、运维),不需要自己做一些硬件设备相关的工作,但那是站出来的结果巨人的肩膀。太浮了
我的专业经验有限,没有亲自接触过几万台规模的项目,但也接触过上千台的热门游戏项目。
当时我是游戏业务的运维,服务器不需要我安装和配置linux系统。专门的IDC运维团队拿到服务器root权限后,我负责业务应用的部署和维护,同时也利用其他同事进行开发。各种CMDB、监控、发布系统等
但是,我有自知之明,不敢声称独立维护数千台服务器的大规模集群