(1)LLM概述與技術(shù)演進:了解大語言模型的發(fā)展歷程(從統(tǒng)計語言模型到神經(jīng)概率模型,再到GPT系列與開源生態(tài))。掌握大模型的核心定義與技術(shù)特征:參數(shù)規(guī)模、涌現(xiàn)能力、上下文學(xué)習(xí)。學(xué)習(xí)大模型的主要分類:僅編碼器架構(gòu)(BERT)、僅解碼器架構(gòu)(GPT系列)、編碼器-解碼器架構(gòu)(T5、BART)的設(shè)計理念與適用場景差異。分析大模型技術(shù)生態(tài)現(xiàn)狀與未來趨勢,包括開源模型(Llama、Qwen、DeepSeek)與閉源模型(GPT-4、Claude)的對比選型。
(2)Transformer架構(gòu)深度解析:深入理解Transformer架構(gòu)的核心技術(shù)邏輯,掌握自注意力機制(Self-Attention)的數(shù)學(xué)原理、計算過程與作用。學(xué)習(xí)多頭注意力(Multi-Head Attention)的并行計算機制、位置編碼(Positional Encoding)的設(shè)計思想(正弦編碼、RoPE旋轉(zhuǎn)位置編碼)。掌握編碼器-解碼器的完整結(jié)構(gòu),理解殘差連接、層歸一化、前饋網(wǎng)絡(luò)等組件的設(shè)計原理。通過代碼實現(xiàn)驗證對各模塊的理解。
(3)大模型預(yù)訓(xùn)練技術(shù)體系:掌握大模型預(yù)訓(xùn)練的完整流程:數(shù)據(jù)工程、模型架構(gòu)、訓(xùn)練策略。學(xué)習(xí)預(yù)訓(xùn)練數(shù)據(jù)源的獲取與處理方法:通用數(shù)據(jù)(網(wǎng)頁、書籍)與專業(yè)數(shù)據(jù)(論文、代碼)的清洗、去重、過濾。理解預(yù)訓(xùn)練任務(wù)的設(shè)計:自回歸語言建模(GPT)、掩碼語言建模(BERT)。掌握分布式訓(xùn)練技術(shù):數(shù)據(jù)并行、張量并行、流水線并行的原理與適用場景。
(4)高效微調(diào)技術(shù)實戰(zhàn):深入理解全參數(shù)微調(diào)與參數(shù)高效微調(diào)的適用場景差異。掌握LoRA(低秩適配)的核心原理:低秩矩陣分解、適配器矩陣設(shè)計、縮放系數(shù)配置。學(xué)習(xí)QLoRA的量化權(quán)重與梯度更新機制,實現(xiàn)在單GPU上微調(diào)大模型。掌握P-Tuning、Adapter、Prefix Tuning等其他PEFT方法的特點。學(xué)習(xí)微調(diào)數(shù)據(jù)集的準(zhǔn)備與格式化(Alpaca格式、ShareGPT格式)。實踐使用LlamaFactory/LLaMA-Factory對開源模型進行垂直領(lǐng)域微調(diào)。
(5)RLHF與模型對齊技術(shù):理解大模型與人類價值觀對齊的必要性。掌握RLHF(基于人類反饋的強化學(xué)習(xí))的三階段流程:監(jiān)督微調(diào)(SFT)、獎勵模型訓(xùn)練(RM)、近端策略優(yōu)化(PPO)。學(xué)習(xí)DPO(直接偏好優(yōu)化)的簡化實現(xiàn)原理。了解對齊過程中的安全挑戰(zhàn):偏見消除、有害內(nèi)容過濾。實踐完成指令微調(diào)與對齊優(yōu)化的完整流程。
(6)提示詞工程與上下文學(xué)習(xí):掌握提示詞(Prompt)的核心設(shè)計原則與高級技巧。學(xué)習(xí)思維鏈(Chain-of-Thought)、思維樹(Tree-of-Thoughts)引導(dǎo)模型展示推理過程的方法。掌握指令調(diào)優(yōu)方法論:逐步細化指令、設(shè)定約束條件、少樣本示例。了解結(jié)構(gòu)化提示、角色代入、多輪對話等復(fù)雜場景的設(shè)計策略。實踐構(gòu)建覆蓋常見應(yīng)用場景的Prompt模板庫。
(7)RAG系統(tǒng)原理與構(gòu)建:深入理解RAG(檢索增強生成)的核心架構(gòu)(索引-檢索-增強-生成)及其在解決模型幻覺、知識時效性問題中的核心價值。學(xué)習(xí)RAG系統(tǒng)的完整工作流程:文檔加載、文本分塊、向量化、索引構(gòu)建、相似度檢索、提示詞增強、生成回答。掌握RAG與模型微調(diào)的適用場景對比與協(xié)同應(yīng)用策略。
(8)向量數(shù)據(jù)庫與檢索優(yōu)化:掌握向量數(shù)據(jù)庫的核心概念與主流產(chǎn)品選型(FAISS、Chroma、Milvus、Qdrant、Weaviate)。學(xué)習(xí)文檔分塊策略的設(shè)計與優(yōu)化:固定大小分塊、語義分塊、遞歸分塊。掌握嵌入模型(Embedding Models)的選型與調(diào)用。學(xué)習(xí)混合檢索策略(稠密檢索+稀疏檢索BM25)與重排序(Re-ranking)技術(shù)的實現(xiàn)。實踐構(gòu)建高性能的知識庫檢索系統(tǒng)。
(9)智能體(Agent)技術(shù)實戰(zhàn):掌握智能體的核心架構(gòu)(感知-規(guī)劃-記憶-執(zhí)行)及其自主決策能力。學(xué)習(xí)單智能體與多智能體系統(tǒng)的設(shè)計模式(ReAct、Reflexion)。掌握工具調(diào)用機制(Function Calling/Tool Use)的實現(xiàn)方法,讓Agent執(zhí)行外部工具(代碼解釋器、API調(diào)用、數(shù)據(jù)庫查詢)。學(xué)習(xí)記憶管理策略:短期記憶(上下文窗口)與長期記憶(向量數(shù)據(jù)庫)結(jié)合。實踐使用LangGraph/CrewAI構(gòu)建多智能體協(xié)作系統(tǒng)。
(10)模型量化與推理優(yōu)化:掌握模型量化的核心原理,理解不同量化精度(FP16、INT8、INT4、NF4)對模型性能和推理速度的影響。學(xué)習(xí)使用AutoGPTQ、AutoAWQ等工具進行模型量化。掌握vLLM的核心優(yōu)化技術(shù):PagedAttention(分頁注意力)、連續(xù)批處理、CUDA核心優(yōu)化。學(xué)習(xí)TensorRT-LLM的部署優(yōu)化。實踐使用vLLM部署高并發(fā)推理服務(wù)。
(11)大模型評估與安全合規(guī):掌握大模型的多維度評估體系:傳統(tǒng)指標(biāo)(BLEU、ROUGE)、指令遵循準(zhǔn)確率、模型質(zhì)量評估(MMLU、HumanEval)、忠實度(Faithfulness)。學(xué)習(xí)RAGAS、TruLens等RAG評估框架的使用。了解大模型的安全風(fēng)險:提示注入、數(shù)據(jù)投毒、隱私泄露。掌握模型合規(guī)實踐:算法備案、內(nèi)容安全審核、數(shù)據(jù)脫敏技術(shù)。
(12)綜合項目實戰(zhàn):垂直領(lǐng)域大模型應(yīng)用開發(fā):結(jié)合所學(xué)知識,完成一個完整的企業(yè)級LLM應(yīng)用項目(如金融領(lǐng)域智能投研助手、醫(yī)療知識問答系統(tǒng)、企業(yè)知識庫智能客服)。涵蓋需求分析、數(shù)據(jù)工程、模型選型與微調(diào)、RAG系統(tǒng)構(gòu)建、智能體開發(fā)、性能優(yōu)化、部署上線的全流程,形成規(guī)范的LLM項目報告。