數(shù)據(jù)挖掘與 AI 融合培訓(xùn)課程
培訓(xùn)對(duì)象:
培訓(xùn)目標(biāo):
使學(xué)員全面掌握從數(shù)據(jù)預(yù)處理、特征工程到經(jīng)典機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法的全鏈路技術(shù)棧;理解數(shù)據(jù)挖掘與 AI 技術(shù)的融合方法,能夠針對(duì)具體業(yè)務(wù)場(chǎng)景(如用戶畫像、推薦系統(tǒng)、智能客服)設(shè)計(jì)并落地端到端的智能解決方案;具備模型評(píng)估、優(yōu)化與線上部署的工程能力。
培訓(xùn)內(nèi)容介紹:
-
數(shù)據(jù)挖掘全流程與 AI 技術(shù)圖譜
詳解 CRISP-DM 行業(yè)標(biāo)準(zhǔn)方法論(業(yè)務(wù)理解-數(shù)據(jù)理解-數(shù)據(jù)準(zhǔn)備-建模-評(píng)估-部署);梳理機(jī)器學(xué)習(xí)算法分類(有監(jiān)督/無(wú)監(jiān)督/強(qiáng)化學(xué)習(xí))與 AI 技術(shù)棧全景圖(傳統(tǒng) ML/深度學(xué)習(xí)/大模型)。
-
Python 數(shù)據(jù)挖掘核心庫(kù)高級(jí)應(yīng)用
NumPy:多維數(shù)組運(yùn)算與廣播機(jī)制;Pandas:復(fù)雜數(shù)據(jù)清洗(缺失值/異常值/重復(fù)值)、分組聚合、數(shù)據(jù)透視與寬表長(zhǎng)表轉(zhuǎn)換;Matplotlib/Seaborn:業(yè)務(wù)數(shù)據(jù)可視化洞察與探索性數(shù)據(jù)分析(EDA)。
-
特征工程:決定模型效果的上限
數(shù)值型特征標(biāo)準(zhǔn)化/歸一化/離散化/分箱;類別型特征編碼(One-Hot/Label/Target Encoding);時(shí)間特征與文本特征提;特征選擇方法(過(guò)濾式/包裹式/嵌入式);特征降維(PCA/SVD)與特征組合。
-
回歸與分類算法深度剖析
回歸:線性回歸(最小二乘法/梯度下降)、嶺回歸與 Lasso、樹模型回歸;分類:邏輯回歸、K-近鄰(KNN)、決策樹(ID3/C4.5/CART)、樸素貝葉斯、支持向量機(jī)(SVM)的原理推導(dǎo)與調(diào)參實(shí)踐。
-
集成學(xué)習(xí)與模型融合
Bagging 與隨機(jī)森林(Random Forest)的方差降低原理;Boosting 算法演進(jìn)(AdaBoost -> GBDT -> XGBoost -> LightGBM);Stacking 模型融合策略;實(shí)戰(zhàn):使用 XGBoost 解決二分類問(wèn)題。
-
聚類與關(guān)聯(lián)規(guī)則挖掘
聚類:K-Means(肘部法則/輪廓系數(shù))、DBSCAN 密度聚類、層次聚類的原理與應(yīng)用場(chǎng)景;關(guān)聯(lián)規(guī)則:Apriori 與 FP-Growth 算法,支持度/置信度/提升度計(jì)算,購(gòu)物籃分析與商品捆綁銷售策略。
-
深度學(xué)習(xí)基礎(chǔ)與圖像/文本處理
神經(jīng)網(wǎng)絡(luò)反向傳播算法推導(dǎo);CNN:卷積/池化/全連接層原理,LeNet/ResNet 結(jié)構(gòu),圖像分類實(shí)戰(zhàn);RNN/LSTM:序列數(shù)據(jù)處理,時(shí)間序列預(yù)測(cè)與文本情感分析。
-
自然語(yǔ)言處理(NLP)與預(yù)訓(xùn)練模型應(yīng)用
文本預(yù)處理(分詞/詞性標(biāo)注/去停用詞);詞向量技術(shù)(Word2Vec/Glove);Transformer 架構(gòu)與自注意力機(jī)制;預(yù)訓(xùn)練模型(BERT/ERNIE)在文本分類、實(shí)體識(shí)別任務(wù)中的微調(diào)實(shí)戰(zhàn)。
-
推薦系統(tǒng):從協(xié)同過(guò)濾到深度排序
召回:基于內(nèi)容召回、協(xié)同過(guò)濾(User-based/Item-based)、矩陣分解(SVD);排序:邏輯回歸 -> FM/FFM -> DeepFM 的演進(jìn);冷啟動(dòng)問(wèn)題解決方案(基于規(guī)則/基于 Bandit 算法)。
-
模型評(píng)估、選擇與調(diào)優(yōu)
評(píng)估指標(biāo):混淆矩陣/PR 曲線/ROC-AUC/KS/對(duì)數(shù)損失;交叉驗(yàn)證方法(K-Fold/Stratified K-Fold);超參數(shù)調(diào)優(yōu):網(wǎng)格搜索/隨機(jī)搜索/貝葉斯優(yōu)化;過(guò)擬合與欠擬合的診斷與應(yīng)對(duì)策略。
-
模型部署與服務(wù)化
使用 Flask/FastAPI 封裝模型為 RESTful API;基于 Docker 的模型容器化;模型版本管理與在線 A/B 測(cè)試設(shè)計(jì);使用 TensorFlow Serving 或 PMML 實(shí)現(xiàn)模型的工業(yè)化部署。
-
綜合實(shí)戰(zhàn):智能推薦與輿情分析融合系統(tǒng)
基于電商用戶行為日志(點(diǎn)擊/購(gòu)買/評(píng)論),數(shù)據(jù)挖掘部分:進(jìn)行用戶分群(RFM + K-Means)與商品關(guān)聯(lián)規(guī)則挖掘;AI 融合部分:使用 BERT 對(duì)用戶評(píng)論進(jìn)行情感分析生成情感標(biāo)簽;系統(tǒng)集成:融合協(xié)同過(guò)濾召回與 DeepFM 排序,結(jié)合用戶情感偏好,構(gòu)建個(gè)性化商品推薦引擎。
如果您想學(xué)習(xí)本課程,請(qǐng)
預(yù)約報(bào)名
如果沒(méi)找到合適的課程或有特殊培訓(xùn)需求,請(qǐng)
訂制培訓(xùn)
除培訓(xùn)外,同時(shí)提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請(qǐng)發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表點(diǎn)擊在線申請(qǐng)
服務(wù)特點(diǎn):
海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項(xiàng)目專家,針對(duì)實(shí)際需求,顧問(wèn)式咨詢,互動(dòng)式授課,案例教學(xué),小班授課,實(shí)際項(xiàng)目演示,快捷高效,省時(shí)省力省錢。
專家力量:
中國(guó)科學(xué)院軟件研究所,計(jì)算研究所高級(jí)研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級(jí)工程師,項(xiàng)目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富
多年實(shí)際項(xiàng)目經(jīng)歷,大型項(xiàng)目實(shí)戰(zhàn)案例,熱情,樂(lè)于技術(shù)分享
針對(duì)客戶實(shí)際需求,案例教學(xué),互動(dòng)式溝通,學(xué)有所獲