一、培訓(xùn)對(duì)象
-
SRE工程師、系統(tǒng)架構(gòu)師、運(yùn)維負(fù)責(zé)人
-
負(fù)責(zé)系統(tǒng)穩(wěn)定性、高可用架構(gòu)設(shè)計(jì)的技術(shù)人員
-
計(jì)劃引入混沌工程實(shí)踐或韌性測(cè)試的團(tuán)隊(duì)
二、培訓(xùn)目標(biāo)
-
理解SRE的核心方法論:SLI/SLO/Error Budget、容量規(guī)劃、故障演練
-
能夠設(shè)計(jì)合理的SLO并進(jìn)行日常燃盡追蹤
-
掌握混沌工程實(shí)驗(yàn)的設(shè)計(jì)原則與工具鏈(如Chaos Mesh、ChaosBlade)
-
通過(guò)主動(dòng)注入故障提升系統(tǒng)的容錯(cuò)與自愈能力
三、培訓(xùn)內(nèi)容介紹
一、SRE核心理念與角色邊界
講解SRE與傳統(tǒng)運(yùn)維的差異、可用性標(biāo)準(zhǔn)、Toil管理、值班輪轉(zhuǎn)與應(yīng)急處置原則。
二、SLI與SLO指標(biāo)體系設(shè)計(jì)
針對(duì)不同服務(wù)類型(HTTP、消息隊(duì)列、DB)設(shè)計(jì)關(guān)鍵可用性與性能指標(biāo),并定義合理的SLO目標(biāo)值與測(cè)量窗口。
三、Error Budget與燃盡分析
計(jì)算錯(cuò)誤預(yù)算,學(xué)習(xí)預(yù)算消耗過(guò)快時(shí)的應(yīng)對(duì)策略(限流、暫停發(fā)布、人工介入),并通過(guò)燃盡圖做風(fēng)險(xiǎn)預(yù)警。
四、容量規(guī)劃與擴(kuò)容策略
結(jié)合負(fù)載測(cè)試與歷史監(jiān)控?cái)?shù)據(jù),設(shè)計(jì)基于CPU、QPS、延遲的自動(dòng)擴(kuò)容/縮容策略,并測(cè)算冗余成本與可用性的平衡。
五、Toil自動(dòng)化與SRE工程效能
識(shí)別高重復(fù)性的運(yùn)維操作,設(shè)計(jì)自動(dòng)化方案減少人工操作,提升SRE團(tuán)隊(duì)的工程化時(shí)間占比。
六、混沌工程原理與安全邊界
講解混沌工程與故障測(cè)試的區(qū)別、爆炸半徑控制原則、終止條件與全鏈路觀測(cè)要求。
七、混沌實(shí)驗(yàn)設(shè)計(jì)過(guò)程
學(xué)習(xí)假設(shè)驅(qū)動(dòng)實(shí)驗(yàn)法:提出系統(tǒng)弱點(diǎn)假設(shè)、確定實(shí)驗(yàn)指標(biāo)、設(shè)計(jì)注入范圍、執(zhí)行并分析結(jié)果。
八、混沌工程工具鏈部署與使用
部署Chaos Mesh或ChaosBlade,演示Pod kill、網(wǎng)絡(luò)延遲、CPU負(fù)載、IO錯(cuò)誤等常見(jiàn)故障注入。
九、應(yīng)用層與中間件混沌實(shí)驗(yàn)
針對(duì)MySQL、Redis、Kafka等中間件,注入連接池滿、主從切換、高延遲等故障,驗(yàn)證服務(wù)降級(jí)與重試邏輯。
十、基礎(chǔ)設(shè)施層混沌實(shí)驗(yàn)(云環(huán)境)
模擬可用區(qū)故障、EIP閃斷、磁盤(pán)滿、節(jié)點(diǎn)關(guān)機(jī)等云資源異常,驗(yàn)證多可用區(qū)容災(zāi)與PDB策略。
十一、實(shí)驗(yàn)觀測(cè)與分析報(bào)告
集成監(jiān)控(Prometheus)與鏈路追蹤(Jaeger),觀察故障前后的指標(biāo)變化,輸出實(shí)驗(yàn)報(bào)告與改進(jìn)項(xiàng)。
十二、混沌工程常態(tài)化與演練日歷
建立每月/每季度的故障演練機(jī)制,將混沌實(shí)驗(yàn)納入發(fā)布前置條件,并建立演練后復(fù)盤(pán)與知識(shí)庫(kù)更新流程。
如果您想學(xué)習(xí)本課程,請(qǐng)
預(yù)約報(bào)名
如果沒(méi)找到合適的課程或有特殊培訓(xùn)需求,請(qǐng)
訂制培訓(xùn)
除培訓(xùn)外,同時(shí)提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請(qǐng)發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表點(diǎn)擊在線申請(qǐng)
服務(wù)特點(diǎn):
海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項(xiàng)目專家,針對(duì)實(shí)際需求,顧問(wèn)式咨詢,互動(dòng)式授課,案例教學(xué),小班授課,實(shí)際項(xiàng)目演示,快捷高效,省時(shí)省力省錢(qián)。
專家力量:
中國(guó)科學(xué)院軟件研究所,計(jì)算研究所高級(jí)研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級(jí)工程師,項(xiàng)目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富
多年實(shí)際項(xiàng)目經(jīng)歷,大型項(xiàng)目實(shí)戰(zhàn)案例,熱情,樂(lè)于技術(shù)分享
針對(duì)客戶實(shí)際需求,案例教學(xué),互動(dòng)式溝通,學(xué)有所獲