智能運(yùn)維與AIOps培訓(xùn)課程大綱(選修)
培訓(xùn)對(duì)象
-
運(yùn)維工程師、SRE(站點(diǎn)可靠性工程師)
-
運(yùn)維開發(fā)(DevOps)人員、平臺(tái)工程師
-
數(shù)據(jù)分析師、算法工程師(希望進(jìn)入運(yùn)維領(lǐng)域)
-
運(yùn)維架構(gòu)師、技術(shù)負(fù)責(zé)人
-
需要了解AIOps的企業(yè)IT管理者
培訓(xùn)目標(biāo)
-
理解智能運(yùn)維(AIOps)的核心理念、發(fā)展歷程與價(jià)值
-
掌握運(yùn)維數(shù)據(jù)采集、處理、存儲(chǔ)與分析的基礎(chǔ)技術(shù)
-
熟悉機(jī)器學(xué)習(xí)在運(yùn)維場(chǎng)景中的常見算法與應(yīng)用
-
能夠運(yùn)用AIOps技術(shù)實(shí)現(xiàn)異常檢測(cè)、告警降噪、根因分析、容量預(yù)測(cè)等
-
了解AIOps平臺(tái)架構(gòu)設(shè)計(jì)與工具選型
-
通過行業(yè)案例掌握AIOps落地實(shí)踐與演進(jìn)路線
培訓(xùn)內(nèi)容
-
智能運(yùn)維(AIOps)概述:AIOps的定義、演進(jìn)歷程、核心價(jià)值與Gartner框架;AIOps與可觀測(cè)性、DevOps、SRE的關(guān)系;典型應(yīng)用場(chǎng)景與成熟度模型。
-
運(yùn)維數(shù)據(jù)采集與處理:多源運(yùn)維數(shù)據(jù)(指標(biāo)、日志、追蹤、事件)的采集技術(shù);常用采集工具(Prometheus、Fluentd、OpenTelemetry)的使用;數(shù)據(jù)清洗、格式化、豐富與標(biāo)簽統(tǒng)一;數(shù)據(jù)緩沖與傳輸(Kafka)實(shí)踐。
-
運(yùn)維數(shù)據(jù)存儲(chǔ)與查詢:時(shí)序數(shù)據(jù)庫(Prometheus、Thanos)、全文檢索引擎(Elasticsearch)、列式存儲(chǔ)(ClickHouse)的選型與對(duì)比;數(shù)據(jù)生命周期管理(降采樣、過期策略);統(tǒng)一查詢語言(PromQL、LogQL、TraceQL)。
-
機(jī)器學(xué)習(xí)基礎(chǔ)與運(yùn)維場(chǎng)景:監(jiān)督/無監(jiān)督/強(qiáng)化學(xué)習(xí)在運(yùn)維中的應(yīng)用;常見算法(回歸、分類、聚類、時(shí)序預(yù)測(cè))與模型評(píng)估指標(biāo);特征工程與模型解釋性(SHAP/LIME)。
-
異常檢測(cè)技術(shù):靜態(tài)閾值與動(dòng)態(tài)閾值方法;統(tǒng)計(jì)方法(3σ、移動(dòng)平均、CUSUM);時(shí)間序列分解(STL)與預(yù)測(cè)模型(ARIMA、Prophet、LSTM);無監(jiān)督異常檢測(cè)(孤立森林、自編碼器);多維度異常檢測(cè)與日志異常檢測(cè)。
-
告警降噪與智能聚合:告警管理挑戰(zhàn)與降噪策略;基于規(guī)則與基于機(jī)器學(xué)習(xí)的告警聚類;告警依賴分析與抑制機(jī)制;告警事件壓縮與生命周期管理;告警有效性度量與自愈響應(yīng)。
-
根因分析與定位:基于拓?fù)涞母蚍治觯ǚ⻊?wù)依賴、調(diào)用鏈傳播);基于指標(biāo)的根因分析(指標(biāo)關(guān)聯(lián)、維度下鉆);基于日志的根因分析(異常日志聚類);多維下鉆算法(HotSpot、iDice);因果推斷與根因推薦系統(tǒng)。
-
容量預(yù)測(cè)與智能擴(kuò)縮容:容量規(guī)劃數(shù)據(jù)來源與預(yù)測(cè)方法(時(shí)序預(yù)測(cè)、周期性模型);深度學(xué)習(xí)時(shí)序預(yù)測(cè)(LSTM、Transformer);預(yù)測(cè)驅(qū)動(dòng)的彈性伸縮策略(HPA、VPA);容量報(bào)告與成本優(yōu)化。
-
智能運(yùn)維平臺(tái)架構(gòu):AIOps平臺(tái)的整體架構(gòu)(采集、存儲(chǔ)、分析、展示、行動(dòng)層);實(shí)時(shí)與離線計(jì)算引擎(Flink、Spark)的應(yīng)用;算法模型管理與在線推理;統(tǒng)一API與可視化設(shè)計(jì)(Grafana);平臺(tái)可觀測(cè)性與自身監(jiān)控。
-
AIOps算法與模型實(shí)踐:典型運(yùn)維算法詳解(異常檢測(cè)、日志聚類、告警聚合、根因分析);開源算法庫(ElastAlert、Kapacitor、Analytics Zoo)的使用;算法性能評(píng)估與持續(xù)迭代。
-
AIOps典型應(yīng)用場(chǎng)景:智能監(jiān)控告警(動(dòng)態(tài)閾值、告警聚合);智能故障診斷(根因分析、故障自愈);智能容量管理(容量預(yù)測(cè)、彈性伸縮);智能日志與調(diào)用鏈分析;智能業(yè)務(wù)分析與成本優(yōu)化;安全運(yùn)維(異常行為檢測(cè))。
-
AIOps落地實(shí)踐與演進(jìn)趨勢(shì):AIOps實(shí)施路線圖(評(píng)估、試點(diǎn)、推廣);數(shù)據(jù)治理與組織能力建設(shè);行業(yè)案例(互聯(lián)網(wǎng)、金融、制造);大語言模型在運(yùn)維中的應(yīng)用(智能問答、根因推理);eBPF對(duì)AIOps的影響;可觀測(cè)性與AIOps融合;未來三年技術(shù)趨勢(shì)與企業(yè)應(yīng)對(duì)。
如果您想學(xué)習(xí)本課程,請(qǐng)
預(yù)約報(bào)名
如果沒找到合適的課程或有特殊培訓(xùn)需求,請(qǐng)
訂制培訓(xùn)
除培訓(xùn)外,同時(shí)提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請(qǐng)發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表點(diǎn)擊在線申請(qǐng)
服務(wù)特點(diǎn):
海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項(xiàng)目專家,針對(duì)實(shí)際需求,顧問式咨詢,互動(dòng)式授課,案例教學(xué),小班授課,實(shí)際項(xiàng)目演示,快捷高效,省時(shí)省力省錢。
專家力量:
中國科學(xué)院軟件研究所,計(jì)算研究所高級(jí)研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級(jí)工程師,項(xiàng)目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富
多年實(shí)際項(xiàng)目經(jīng)歷,大型項(xiàng)目實(shí)戰(zhàn)案例,熱情,樂于技術(shù)分享
針對(duì)客戶實(shí)際需求,案例教學(xué),互動(dòng)式溝通,學(xué)有所獲