了解最新公司动态及行业资讯
在当今互联网时代,我们的IT运维、技术等相关人员面临以下问题和困惑:
-听说SRE工程师的薪水很高,有没有综合学习的机会?
-SRE 是技术还是工作?工资高的原因是什么?
-SRE和-SRE有什么关系?具体有什么区别?
-研发团队正在流水线上工作。作为运维人员,如何参与?
-SLO 怎么了?如何在企业内部实施?
-听说“可观察性”正在逐渐取代监控it运维技术,您如何理解“可观察性”?
什么是 SRE?
SRE 的全称是 Site。 SRE 最早由其工程实践提出并在其工程实践中发扬光大。出版同名著作《Site》,在互联网工程师圈内广为传播。 SRE(站点可靠性工程)是一门结合软件工程各个方面并将其应用于基础设施和运营问题的学科,于 2003 年左右在 创建并通过 SRE 相关书籍进行推广。 SRE是一门学科it运维技术,SRE是一种最佳实践,SRE是一种创新立场。
为什么要学习 SRE?
传统运维模式(Dev/Ops分离团队模式)的冲突焦点:
战略层面:
1、直接成本比较明确。
2、间接成本差异很大(背景、技术能力、工具习惯、工作目标)。
最初演变为目标方向的差异和严重的内部沟通问题,逐渐发展为部门之间的信任和尊重。
战术级别:
传统研发团队和运维团队的区别主要在于新软件版本的发布速度和新的配置变化。
执行级别:
1、开发组宣布不再进行大规模的程序更新,而是进行功能开关调整、增量更新和补丁(大改→小改)。为了绕过运维团队设置的各种流程,可以更快地推出新功能。
2、绕过运维团队设置的新服务/变更发布流程,加速了新功能的上线,但事件仍在反复发生,导致服务质量不佳。
冲突解决:SRE
SRE 模型的优点:
1)运维次数比较少;
2)消除了开发团队和运维团队的冲突焦点;
3)提升产品分工水平,成员可以在SRE团队和研发团队之间自由流动。
SRE 是一种最佳实践:
SRE和属于开发运维一体化时代的产品很正常,有交集也很正常。 SRE可以是运维向运维研发的拓展,可以应用于国内广泛的运维部门转型。其实,还是“开发运维一体化”在国内刚刚开始实施。很多组织只是引入概念,还需要面对“生产环境每天都有问题,就是不知道问题出在哪里”的问题。
SRE 可以理解为一种具体的实践。而不是有更具体的工作或角色定义。
1、SRE的主要思想如下:
意外是正常的/变化应该是渐进的/工具和文化是相关的/衡量的。
2、SRE的主要原理或核心如下:
2.1 软件问题:用软工程的思想解决运维领域的问题;
2.2 通过 SLO 管理:产品团队和 SRE 团队为服务及其用户群选择适当的可用性目标,并根据该 SLO 管理服务;
2.3 尽量减少家务:找出家务的来源,以便尽量减少甚至消除;
2.4 自动化:决定在什么条件下自动化什么以及如何自动化;
2.5 与开发者共享:工件透明、信息共享、工具同步;
2.6 持续改进:快速试错,快速改进,更高效,更可靠,增加收入;
SRE 课程是关于什么的?
1.互联网时代IT运维精英能力分析
2.如何成为稀缺的高薪SRE人才
3.SRE起源与实践总结
4.SRE 自动化实践
5.服务水平目标和错误预算
6.劳苦(劳苦)
7.监控和服务水平指标
8.SRE 工具和自动化
9.反脆弱和从失败中学习
10.SRE框架及发展趋势
参加 SRE 课程可以获得什么?
SRE 代表了行业现有管理大型复杂服务的最佳实践的重要突破。由于目前全球领先,SRE模型可以为广大企业提供深度模仿或借鉴。
通过学习和掌握SRE,将带来以下好处:
-SRE 学习路径
-SRE 主导的自动化
-服务水平目标 (SLO)
-如何减少家务(Toil)
-可观察性()
-入门
国际知名研究院(DOI)推出的SRE认证代表了该领域最新的知识体系。该认证介绍了SRE的发展及其未来方向,为学生提供了SRE的最新理念、实践方法和日常生活。可以帮助现有 SRE 团队将现有 SRE 实践与国际理论标准相结合的工具,以增强 SRE 实践能力。亚飞傲朗联合推出SRE系列认证培训,成为国内首家授权全系列SRE课程培训考试机构。
更多 SRE 学习资料: