(1)大模型概述與技術演進:了解大語言模型的發(fā)展歷程(從統(tǒng)計語言模型到神經概率模型,再到Transformer架構)。掌握大模型的核心定義與技術特征:參數(shù)規(guī)模、涌現(xiàn)能力、上下文學習。學習大模型的主要分類:僅編碼器架構(BERT)、僅解碼器架構(GPT系列)、編碼器-解碼器架構(T5、BART)的設計理念與適用場景差異。分析大模型技術生態(tài)現(xiàn)狀與未來趨勢,包括開源模型(Llama、Qwen、DeepSeek)與閉源模型(GPT-4、Claude)的對比選型。
(2)Transformer架構深度解析:深入理解Transformer架構的核心技術邏輯,掌握自注意力機制(Self-Attention)的數(shù)學原理、計算過程與作用。學習多頭注意力(Multi-Head Attention)的并行計算機制、位置編碼(Positional Encoding)的設計思想(正弦編碼、RoPE旋轉位置編碼)。掌握編碼器(Encoder)與解碼器(Decoder)的架構差異,理解BERT與GPT的技術路線區(qū)別。通過代碼實現(xiàn)驗證對各模塊的理解。
(3)大模型預訓練技術體系:掌握大模型預訓練的完整流程:數(shù)據工程、模型架構、訓練策略。學習預訓練數(shù)據源的獲取與處理方法:通用數(shù)據(網頁、書籍)與專業(yè)數(shù)據(論文、代碼)的清洗、去重、過濾。理解預訓練任務的設計:自回歸語言建模(GPT)、掩碼語言建模(BERT)。掌握分布式訓練技術:數(shù)據并行、張量并行、流水線并行的原理與適用場景。
(4)數(shù)據集預處理與構建:掌握大模型數(shù)據預處理的核心技術,理解數(shù)據質量對模型性能的決定性影響。學習數(shù)據集類型與來源:通用數(shù)據與專業(yè)數(shù)據的獲取策略。掌握數(shù)據格式規(guī)范:問答格式(QA Pairs)、對話格式(Conversational Format)、指令微調格式(Alpaca格式)、通用結構化格式(JSON/JSONL)。學習數(shù)據清洗、分塊、標注與存儲的完整流程。
(5)提示詞工程高級技巧:掌握提示詞(Prompt)的核心設計原則與高級技巧。學習思維鏈(Chain-of-Thought)、思維樹(Tree-of-Thoughts)引導模型展示推理過程的方法。掌握指令調優(yōu)方法論:逐步細化指令、設定約束條件、少樣本示例。了解結構化提示、角色代入、多輪對話等復雜場景的設計策略。實踐構建覆蓋常見應用場景的Prompt模板庫。
(6)高效微調技術實戰(zhàn):深入理解全參數(shù)微調與參數(shù)高效微調的適用場景差異。掌握LoRA(低秩適配)的核心原理:低秩矩陣分解、適配器矩陣設計、縮放系數(shù)配置。學習QLoRA的量化權重與梯度更新機制,實現(xiàn)在單GPU上微調大模型。掌握P-Tuning、Adapter、Prefix Tuning等其他PEFT方法的特點。實踐使用LlamaFactory對開源模型進行垂直領域微調。
(7)RLHF與模型對齊技術:理解大模型與人類價值觀對齊的必要性。掌握RLHF(基于人類反饋的強化學習)的三階段流程:監(jiān)督微調(SFT)、獎勵模型訓練(RM)、近端策略優(yōu)化(PPO)。學習DPO(直接偏好優(yōu)化)的簡化實現(xiàn)原理。了解對齊過程中的安全挑戰(zhàn):偏見消除、有害內容過濾。
(8)RAG系統(tǒng)原理與構建:深入理解RAG(檢索增強生成)的核心架構(索引-檢索-增強-生成)及其在解決模型幻覺、知識時效性問題中的核心價值。學習RAG系統(tǒng)的完整工作流程:文檔加載、文本分塊、向量化、索引構建、相似度檢索、提示詞增強、生成回答。掌握向量數(shù)據庫的核心概念與主流產品選型(FAISS、Chroma、Milvus、Qdrant)。學習混合檢索策略(稠密檢索+稀疏檢索BM25)與重排序(Re-ranking)技術的實現(xiàn)。
(9)智能體(Agent)技術實戰(zhàn):掌握智能體的核心架構(感知-規(guī)劃-記憶-執(zhí)行)及其自主決策能力。學習單智能體與多智能體系統(tǒng)的設計模式(ReAct、Reflection)。掌握工具調用機制(Function Calling/Tool Use)的實現(xiàn)方法,讓Agent執(zhí)行外部工具(代碼解釋器、API調用、數(shù)據庫查詢)。學習記憶管理策略:短期記憶(上下文窗口)與長期記憶(向量數(shù)據庫)結合。實踐使用LangGraph/CrewAI構建多智能體協(xié)作系統(tǒng)。
(10)LangChain應用開發(fā)框架:掌握LangChain框架的核心組件與使用方法。學習文檔加載器、文本分割器、向量存儲、檢索器、提示詞模板的鏈式組裝。深入理解Chains模塊:LLMChain、SimpleSequentialChain、SequentialChain、RouterChain。掌握Conversational Memory機制:ConversationBufferMemory、ConversationSummaryMemory、EntityMemory等。實踐使用LangChain構建企業(yè)知識庫問答機器人。
(11)模型量化與推理優(yōu)化:掌握模型量化的核心原理,理解不同量化精度(FP16、INT8、INT4、NF4)對模型性能和推理速度的影響。學習使用AutoGPTQ、AutoAWQ等工具進行模型量化。掌握vLLM的核心優(yōu)化技術:PagedAttention(分頁注意力)、連續(xù)批處理、CUDA核心優(yōu)化。學習TensorRT-LLM的部署優(yōu)化。實踐使用vLLM部署高并發(fā)推理服務。
(12)綜合項目實戰(zhàn):企業(yè)級大模型應用開發(fā):結合所學知識,完成一個完整的企業(yè)級大模型應用項目(如金融領域智能投研助手、醫(yī)療知識問答系統(tǒng)、企業(yè)知識庫智能客服、多模態(tài)內容生成平臺)。涵蓋需求分析、數(shù)據工程、模型選型與微調、RAG系統(tǒng)構建、智能體開發(fā)、性能優(yōu)化、部署上線的全流程,形成規(guī)范的大模型項目報告。