
|
課程培訓(xùn)
|
機(jī)器學(xué)習(xí)(回歸、分類、聚類、時間序列)培訓(xùn)
機(jī)器學(xué)習(xí)(回歸、分類、聚類、時間序列)培訓(xùn)課程大綱
培訓(xùn)對象:
培訓(xùn)目標(biāo):
培訓(xùn)內(nèi)容介紹:
一、機(jī)器學(xué)習(xí)概述與數(shù)學(xué)基礎(chǔ) 1.1 機(jī)器學(xué)習(xí)概念與分類:機(jī)器學(xué)習(xí)的定義與發(fā)展歷程;監(jiān)督學(xué)習(xí)(回歸/分類)與非監(jiān)督學(xué)習(xí)(聚類/降維)的區(qū)別;機(jī)器學(xué)習(xí)項目的一般流程(CRISP-DM方法論);四大核心任務(wù)的應(yīng)用場景概述。 1.2 數(shù)學(xué)基礎(chǔ)回顧:線性代數(shù)基礎(chǔ)(向量/矩陣運(yùn)算/特征值);概率論基礎(chǔ)(隨機(jī)變量/概率分布/貝葉斯定理);微積分與最優(yōu)化(導(dǎo)數(shù)/梯度下降法);偏差-方差權(quán)衡與過擬合概念。
二、Python數(shù)據(jù)科學(xué)工具棧 2.1 開發(fā)環(huán)境搭建:Anaconda安裝與配置;Jupyter Notebook使用;虛擬環(huán)境管理。 2.2 數(shù)據(jù)科學(xué)核心庫:NumPy數(shù)值計算(數(shù)組操作/廣播機(jī)制/聚合計算);Pandas數(shù)據(jù)處理(Series/DataFrame/數(shù)據(jù)清洗/分組聚合);Matplotlib/Seaborn數(shù)據(jù)可視化基礎(chǔ)。 2.3 Scikit-learn建;A(chǔ):統(tǒng)一建模接口(fit/predict/score);數(shù)據(jù)集劃分(train_test_split);數(shù)據(jù)預(yù)處理工具(StandardScaler/OneHotEncoder);Pipeline構(gòu)建與使用。
三、回歸分析 3.1 回歸問題概述:回歸任務(wù)定義(預(yù)測連續(xù)值);應(yīng)用場景(房價預(yù)測/銷量預(yù)測/風(fēng)險評估);回歸與分類的區(qū)別。 3.2 線性回歸:一元線性回歸原理(最小二乘法/梯度下降);多元線性回歸;模型評估指標(biāo)(MSE/RMSE/MAE/R²);模型顯著性檢驗(F檢驗/t檢驗)。 3.3 正則化回歸:過擬合問題與正則化思想;嶺回歸(L2正則化);Lasso回歸(L1正則化)與特征選擇;ElasticNet彈性網(wǎng)絡(luò)。 3.4 回歸模型診斷:殘差分析(正態(tài)性/同方差性/獨立性);共線性診斷(VIF);異常值與強(qiáng)影響點識別(Cook距離)。 3.5 非線性回歸:多項式回歸;廣義加性模型(GAM)簡介;回歸模型在業(yè)務(wù)預(yù)測中的應(yīng)用案例。
四、分類算法(上)——邏輯回歸與KNN 4.1 分類問題概述:分類任務(wù)定義(預(yù)測離散類別);應(yīng)用場景(信用評分/客戶流失/欺詐檢測);二分類與多分類問題。 4.2 邏輯回歸:邏輯回歸原理(Sigmoid函數(shù)/最大似然估計);二項與多項邏輯回歸;邏輯回歸系數(shù)解讀(優(yōu)勢比);邏輯回歸在信貸審批中的應(yīng)用。 4.3 K-近鄰(KNN)算法:KNN原理(距離度量/K值選擇/決策規(guī)則);KD樹與Ball樹加速;KNN參數(shù)調(diào)優(yōu);KNN適用場景與局限性。 4.4 分類模型評估指標(biāo):混淆矩陣與代價矩陣;準(zhǔn)確率/精確率/召回率/F1-score;ROC曲線與AUC值;PR曲線適用場景(不平衡數(shù)據(jù))。
五、分類算法(中)——決策樹與樸素貝葉斯 5.1 決策樹算法:決策樹原理(樹結(jié)構(gòu)/分裂準(zhǔn)則);信息增益、基尼系數(shù)與增益率;常用決策樹算法(ID3/C4.5/CART);決策樹剪枝策略(預(yù)剪枝/后剪枝);決策樹可視化與規(guī)則提取。 5.2 樸素貝葉斯:貝葉斯定理基礎(chǔ);樸素貝葉斯條件獨立假設(shè);三種樸素貝葉斯模型(高斯/多項式/伯努利);樸素貝葉斯在文本分類中的應(yīng)用。 5.3 不平衡數(shù)據(jù)處理:不平衡數(shù)據(jù)定義與影響;數(shù)據(jù)層面方法(過采樣SMOTE/欠采樣);算法層面方法(代價敏感學(xué)習(xí)/閾值調(diào)整);評估指標(biāo)選擇(F1-score/AUC-PR)。
六、分類算法(下)——支持向量機(jī)與集成學(xué)習(xí) 6.1 支持向量機(jī)(SVM):SVM基本原理(最大間隔超平面);線性可分與線性不可分問題;核函數(shù)技巧(線性核/多項式核/RBF核);軟間隔與懲罰參數(shù)C;SVM參數(shù)調(diào)優(yōu)。 6.2 集成學(xué)習(xí)思想:集成學(xué)習(xí)理論基礎(chǔ)(弱學(xué)習(xí)器組合強(qiáng)學(xué)習(xí)器);Bagging與Boosting對比。 6.3 Bagging與隨機(jī)森林:Bagging原理(Bootstrap聚合);隨機(jī)森林算法(特征隨機(jī)采樣);特征重要性分析;隨機(jī)森林在金融風(fēng)控中的應(yīng)用。 6.4 Boosting算法:AdaBoost原理(樣本權(quán)重調(diào)整);梯度提升樹(GBDT);XGBoost原理與優(yōu)勢;LightGBM與CatBoost簡介。 6.5 模型融合策略:投票法(硬投票/軟投票);平均法;堆疊法(Stacking)。
七、聚類分析 7.1 無監(jiān)督學(xué)習(xí)概述:無監(jiān)督學(xué)習(xí)定義與價值;聚類問題與應(yīng)用場景(客戶分群/圖像分割/異常檢測)。 7.2 相似性度量:距離度量(歐氏距離/曼哈頓距離/余弦相似度);相似度與相異度概念。 7.3 K-Means聚類:K-Means算法原理與步驟;K值選擇(肘部法則/輪廓系數(shù));K-Means++初始化;K-Means優(yōu)缺點與應(yīng)用場景。 7.4 層次聚類:層次聚類原理(凝聚式/分裂式);距離度量方法(單鏈/全鏈/平均鏈/Ward);樹狀圖(Dendrogram)解讀。 7.5 DBSCAN密度聚類:DBSCAN原理(核心點/邊界點/噪音點);參數(shù)選擇(ε/MinPts);DBSCAN優(yōu)缺點(識別任意形狀聚類/抗噪)。 7.6 聚類評估:外部指標(biāo)(ARI/AMI/NMI);內(nèi)部指標(biāo)(輪廓系數(shù)/Calinski-Harabasz指數(shù))。 7.7 降維與可視化:主成分分析(PCA)原理;t-SNE與UMAP高維數(shù)據(jù)可視化;聚類在客戶分群中的應(yīng)用案例。
八、時間序列分析與預(yù)測 8.1 時間序列基礎(chǔ):時間序列定義與成分(趨勢/季節(jié)/循環(huán)/隨機(jī));平穩(wěn)性概念;自相關(guān)與偏自相關(guān)函數(shù);時間序列可視化與探索。 8.2 時間序列預(yù)處理:缺失值處理;重采樣(升采樣/降采樣);時間特征工程(滯后特征/滾動窗口特征);訓(xùn)練集與測試集劃分(時間序列交叉驗證)。 8.3 經(jīng)典時序模型:移動平均法(SMA/WMA);指數(shù)平滑法(SES/Holt/Holt-Winters);季節(jié)性分解。 8.4 ARIMA模型:AR模型(自回歸)原理;MA模型(移動平均)原理;ARIMA模型(整合移動平均自回歸);模型識別(ACF/PACF定階);季節(jié)性ARIMA(SARIMA)。 8.5 機(jī)器學(xué)習(xí)時序預(yù)測:時間序列轉(zhuǎn)換為監(jiān)督學(xué)習(xí)問題;特征構(gòu)造(滯后特征/滾動統(tǒng)計);樹模型時序預(yù)測(XGBoost/LightGBM);多步預(yù)測策略(直接預(yù)測/遞歸預(yù)測)。 8.6 深度學(xué)習(xí)時序預(yù)測:RNN/LSTM原理;GRU時序預(yù)測;LSTM在銷售預(yù)測中的應(yīng)用。 8.7 預(yù)測評估:預(yù)測誤差指標(biāo)(MAE/MSE/RMSE/MAPE/sMAPE);預(yù)測區(qū)間與置信區(qū)間;模型比較與選擇(AIC/BIC)。
九、模型評估、選擇與優(yōu)化 9.1 模型評估方法:留出法(Hold-out);K折交叉驗證(K-Fold);分層K折交叉驗證(Stratified K-Fold);時間序列交叉驗證(Time Series Split)。 9.2 學(xué)習(xí)曲線與驗證曲線:學(xué)習(xí)曲線解讀(欠擬合/過擬合診斷);驗證曲線參數(shù)調(diào)優(yōu)指導(dǎo)。 9.3 超參數(shù)調(diào)優(yōu):手動調(diào)優(yōu)(經(jīng)驗法);網(wǎng)格搜索(Grid Search)原理與實現(xiàn);隨機(jī)搜索(Randomized Search);貝葉斯優(yōu)化(Bayesian Optimization)簡介。 9.4 模型選擇準(zhǔn)則:偏差-方差權(quán)衡;模型復(fù)雜度與泛化能力;模型比較與統(tǒng)計檢驗。
十、綜合實戰(zhàn)項目 10.1 回歸項目:房價預(yù)測/銷售預(yù)測;數(shù)據(jù)探索→特征工程→線性回歸/正則化回歸→模型評估與診斷。 10.2 分類項目:銀行客戶流失預(yù)測/信用卡欺詐檢測;不平衡數(shù)據(jù)處理→多模型對比(邏輯回歸/決策樹/隨機(jī)森林/XGBoost)→模型評估→業(yè)務(wù)策略制定。 10.3 聚類項目:客戶價值分群(RFM特征構(gòu)建);K-Means/層次聚類/DBSCAN對比→聚類結(jié)果評估→客戶畫像構(gòu)建→精準(zhǔn)營銷策略。 10.4 時間序列項目:銷量預(yù)測/電力負(fù)荷預(yù)測;時間序列分解→平穩(wěn)性檢驗→ARIMA/機(jī)器學(xué)習(xí)模型對比→預(yù)測結(jié)果評估。 如果您想學(xué)習(xí)本課程,請預(yù)約報名
如果沒找到合適的課程或有特殊培訓(xùn)需求,請訂制培訓(xùn) 除培訓(xùn)外,同時提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916 技術(shù)服務(wù)需求表點擊在線申請 服務(wù)特點: 海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項目專家,針對實際需求,顧問式咨詢,互動式授課,案例教學(xué),小班授課,實際項目演示,快捷高效,省時省力省錢。 專家力量: 中國科學(xué)院軟件研究所,計算研究所高級研究人員 oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級工程師,項目經(jīng)理,技術(shù)支持專家 中科信軟培訓(xùn)中心,資深專家或講師 大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富 多年實際項目經(jīng)歷,大型項目實戰(zhàn)案例,熱情,樂于技術(shù)分享 針對客戶實際需求,案例教學(xué),互動式溝通,學(xué)有所獲 |
|