(1)金融大數(shù)據(jù)概述與技術(shù)生態(tài):了解金融大數(shù)據(jù)的定義、發(fā)展歷程與核心價值。掌握金融大數(shù)據(jù)的來源構(gòu)成:交易數(shù)據(jù)、客戶信息、市場數(shù)據(jù)、另類數(shù)據(jù)(社交媒體、衛(wèi)星圖像)。學習金融大數(shù)據(jù)在銀行、證券、保險三大領(lǐng)域的典型應(yīng)用場景。熟悉金融大數(shù)據(jù)技術(shù)生態(tài):Hadoop、Spark、Flink等分布式計算框架在金融領(lǐng)域的應(yīng)用定位。
(2)金融數(shù)據(jù)采集與預(yù)處理:掌握金融數(shù)據(jù)的多種采集方式:手動采集、自動采集(API接口)、數(shù)據(jù)庫導入。學習金融數(shù)據(jù)預(yù)處理的完整流程:缺失值處理、異常值檢測、重復(fù)數(shù)據(jù)處理、數(shù)據(jù)標準化。掌握Python/Pandas進行金融時間序列數(shù)據(jù)的重采樣與對齊技術(shù)。實踐從Tushare、AKShare等金融數(shù)據(jù)接口獲取股票、基金、期貨數(shù)據(jù)。
(3)金融數(shù)據(jù)存儲與管理:掌握關(guān)系型數(shù)據(jù)庫(MySQL)與非關(guān)系型數(shù)據(jù)庫(MongoDB、Redis)在金融數(shù)據(jù)存儲中的適用場景。學習金融數(shù)據(jù)質(zhì)檢方法:完整性檢查、準確性驗證、一致性校驗。了解金融數(shù)據(jù)安全規(guī)范:數(shù)據(jù)脫敏、加密存儲、訪問控制。實踐構(gòu)建本地金融數(shù)據(jù)庫,實現(xiàn)數(shù)據(jù)的高效存儲與查詢。
(4)金融數(shù)據(jù)可視化分析:掌握數(shù)據(jù)可視化的核心原則與圖表選擇策略。學習使用Matplotlib、Seaborn、Plotly繪制金融數(shù)據(jù)特征圖:K線圖、成交量圖、相關(guān)性熱力圖、時間序列趨勢圖。掌握交互式可視化工具Tableau/PowerBI在金融報表中的應(yīng)用。實踐完成一份完整的金融市場可視化分析報告。
(5)金融特征工程與指標構(gòu)建:理解特征工程在金融建模中的關(guān)鍵作用。學習金融領(lǐng)域常用技術(shù)指標的構(gòu)建:移動平均線、RSI、MACD、布林帶。掌握衍生特征構(gòu)造方法:滯后特征、滾動統(tǒng)計特征、差分特征。學習特征選擇技術(shù):相關(guān)性分析、互信息、主成分分析(PCA)。實踐構(gòu)建股票預(yù)測模型的特征矩陣。
(6)金融分類算法與應(yīng)用:掌握分類算法在金融領(lǐng)域的核心應(yīng)用場景:信用評分、客戶流失預(yù)測、欺詐檢測。學習邏輯回歸、決策樹、隨機森林、XGBoost等分類算法的原理與金融適用性。實踐基于Kaggle信用風險數(shù)據(jù)集的違約預(yù)測建模,完成從數(shù)據(jù)清洗、模型訓練到評估的全流程。
(7)金融回歸算法與應(yīng)用:掌握回歸算法在金融領(lǐng)域的核心應(yīng)用場景:股價預(yù)測、收益率預(yù)測、風險度量。學習線性回歸、嶺回歸、Lasso回歸、時間序列回歸的原理與實現(xiàn)。實踐基于歷史數(shù)據(jù)構(gòu)建股票收益率預(yù)測模型,評估模型預(yù)測準確性。
(8)金融聚類算法與應(yīng)用:掌握聚類算法在金融領(lǐng)域的核心應(yīng)用場景:客戶分群、市場細分、異常檢測。學習K-means、層次聚類、DBSCAN等算法的原理與金融適用性。實踐基于銀行客戶交易數(shù)據(jù)進行客戶畫像與分群分析,實現(xiàn)精準營銷策略制定。
(9)金融關(guān)聯(lián)分析與推薦系統(tǒng):掌握關(guān)聯(lián)分析在金融領(lǐng)域的應(yīng)用場景:產(chǎn)品交叉銷售、購物籃分析、交易模式挖掘。學習Apriori算法、FP-Growth算法的原理與實現(xiàn)。實踐基于銀行理財產(chǎn)品購買記錄進行關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)產(chǎn)品組合推薦策略。
(10)金融時間序列分析與預(yù)測:掌握金融時間序列的獨特特征:趨勢性、季節(jié)性、波動聚集性。學習ARIMA、GARCH等傳統(tǒng)時間序列模型的原理與應(yīng)用。理解深度學習在時序預(yù)測中的應(yīng)用:LSTM、TCN、Transformer架構(gòu)在股價預(yù)測中的表現(xiàn)對比。實踐完成股票價格或市場指數(shù)的預(yù)測建模。
(11)金融風控與信用評分實戰(zhàn):理解商業(yè)銀行大數(shù)據(jù)風控體系的完整架構(gòu)。掌握信用評分的核心方法論:評分卡構(gòu)建、WOE編碼、IV值篩選。學習貸前、貸中、貸后全流程風控模型的構(gòu)建與應(yīng)用。實踐基于真實信貸數(shù)據(jù)進行信用評分卡開發(fā)。
(12)綜合項目實戰(zhàn):金融大數(shù)據(jù)分析系統(tǒng)開發(fā):結(jié)合所學知識,完成一個完整的金融大數(shù)據(jù)項目(如銀行客戶流失預(yù)測系統(tǒng)、量化投資策略回測平臺、智能風控評分系統(tǒng))。涵蓋需求分析、數(shù)據(jù)采集、特征工程、模型訓練、結(jié)果可視化與部署上線的全流程,形成規(guī)范的金融大數(shù)據(jù)項目報告。