(1)推薦系統(tǒng)概述與架構(gòu)設計:了解推薦系統(tǒng)的發(fā)展歷程、應用場景(電商、短視頻、新聞、音樂)和核心價值。掌握推薦系統(tǒng)的整體架構(gòu)設計(召回層、排序?qū)、重排序(qū)樱斫飧髂K的職責和協(xié)同邏輯。學習推薦系統(tǒng)的評估指標(準確率、召回率、命中率、AUC、NDCG等)和AB測試方法。
(2)數(shù)據(jù)處理與特征工程實戰(zhàn):掌握推薦系統(tǒng)數(shù)據(jù)處理的完整流程,包括數(shù)據(jù)采集、清洗、采樣和歸一化。學習用戶畫像構(gòu)建方法(人口屬性、興趣標簽、行為序列),物品特征提取(內(nèi)容屬性、類別標簽、Embedding表示),以及上下文特征(時間、地點、設備)的應用。通過實戰(zhàn)完成特征選擇和特征工程文檔編制。
(3)基于鄰域的協(xié)同過濾算法:深入理解協(xié)同過濾的核心思想,掌握基于用戶的協(xié)同過濾(UserCF)和基于物品的協(xié)同過濾(ItemCF)的原理與實現(xiàn)。學習相似度計算方法(余弦相似度、皮爾遜相關(guān)系數(shù)、Jaccard相似度)的適用場景。實戰(zhàn)實現(xiàn)UserCF和ItemCF算法,完成商品推薦系統(tǒng)的構(gòu)建。
(4)矩陣分解與隱語義模型:理解隱語義模型(LFM)的核心思想,掌握矩陣分解技術(shù)(SVD、SVD++、ALS)在推薦系統(tǒng)中的應用。學習利用隱向量表示用戶和物品的興趣特征,解決協(xié)同過濾的數(shù)據(jù)稀疏性問題。實戰(zhàn)使用Spark MLlib實現(xiàn)基于ALS的協(xié)同過濾推薦。
(5)基于內(nèi)容的推薦與Embedding技術(shù):掌握基于內(nèi)容推薦的核心方法,包括向量空間模型、TF-IDF、文本挖掘和主題模型(LDA)的應用。學習Embedding技術(shù)的基礎(Word2vec、Item2vec、Graph Embedding)及其在召回階段的應用。實戰(zhàn)實現(xiàn)基于物品Embedding的相似推薦。
(6)深度學習召回模型實戰(zhàn):深入理解深度召回模型的發(fā)展脈絡,學習DSSM雙塔模型、Youtube深度學習召回架構(gòu)的核心思想。掌握Graph神經(jīng)網(wǎng)絡召回算法(Personal Rank、Node2vec、EGES)的原理與應用。實戰(zhàn)實現(xiàn)基于深度學習的召回模型,完成大規(guī)模候選集的快速篩選。
(7)排序模型:邏輯回歸與GBDT:理解Learning to Rank的基本概念和排序模型分類(Pointwise、Pairwise、Listwise)。掌握邏輯回歸在CTR預估中的應用,學習GBDT+LR混合模型的原理與優(yōu)勢。實戰(zhàn)實現(xiàn)基于邏輯回歸的點擊預估模型訓練和線上推薦服務。
(8)深度學習排序模型實戰(zhàn):掌握深度學習排序模型的演進路線,深入理解Wide & Deep、DeepFM、xDeepFM等經(jīng)典模型的架構(gòu)原理。學習注意力機制、多目標優(yōu)化(ESMM)在排序中的應用。實戰(zhàn)使用TensorFlow實現(xiàn)Wide & Deep模型,完成排序?qū)拥挠柧毰c優(yōu)化。
(9)重排序與多目標優(yōu)化:學習重排序階段的核心技術(shù),包括多樣性算法(MMR、DPP)、商業(yè)規(guī)則融入和業(yè)務指標對齊。掌握多目標排序的挑戰(zhàn)與解決方案,理解ESMM、MMoE等多任務學習模型的原理。實戰(zhàn)實現(xiàn)推薦結(jié)果的多樣性調(diào)整和業(yè)務規(guī)則融合。
(10)推薦系統(tǒng)工業(yè)級挑戰(zhàn)與應對:深入理解推薦系統(tǒng)在實際落地中的核心挑戰(zhàn)及解決方案。掌握冷啟動問題的處理策略(基于人口統(tǒng)計、基于內(nèi)容、探索利用Bandit算法)。學習實時推薦技術(shù)(在線學習FTRL、流式計算、準實時特征更新)。了解EE(探索與利用)問題的經(jīng)典算法和模型評估效果定位問題的方法。
(11)推薦系統(tǒng)工程架構(gòu)與部署:了解工業(yè)級推薦系統(tǒng)的完整工程架構(gòu),包括數(shù)據(jù)倉庫搭建(Hadoop/Hive)、ETL數(shù)據(jù)處理流程、近線/在線存儲選型(Redis/HBase)。掌握推薦服務的在線部署方案(RESTful API、緩存優(yōu)化、毫秒級響應保障)。學習推薦引擎的架構(gòu)設計和多角色協(xié)同(大數(shù)據(jù)工程師、算法工程師、后端工程師的職責分工)。
(12)綜合項目實戰(zhàn):全鏈路推薦系統(tǒng)搭建:結(jié)合所學知識,完成一個完整的推薦系統(tǒng)項目(如電影推薦系統(tǒng)、電商商品推薦或新聞信息流推薦)。涵蓋需求分析、數(shù)據(jù)處理、召回/排序/重排序模型構(gòu)建、離線評估、在線服務和效果分析的工業(yè)化全流程,形成規(guī)范的推薦系統(tǒng)項目報告。