-
-
培訓對象:
-
適合具備Python編程基礎(chǔ),了解機器學習基本概念,希望系統(tǒng)掌握大模型技術(shù)在各行業(yè)應(yīng)用落地能力的算法工程師、AI應(yīng)用開發(fā)者、技術(shù)架構(gòu)師、產(chǎn)品經(jīng)理及計算機相關(guān)專業(yè)學生。
-
-
培訓目標:
-
完成本課程后,學員將能夠深入理解大語言模型的核心技術(shù)原理與能力邊界,熟練掌握大模型應(yīng)用開發(fā)的完整技術(shù)棧,包括提示詞工程、檢索增強生成(RAG)、智能體(Agent)開發(fā)、模型微調(diào)等關(guān)鍵技術(shù),具備將大模型技術(shù)應(yīng)用于金融、醫(yī)療、法律、教育等垂直領(lǐng)域的工程能力,能夠獨立完成從業(yè)務(wù)需求分析、技術(shù)方案設(shè)計到應(yīng)用開發(fā)部署的完整項目交付。
-
-
培訓內(nèi)容:
-
(1)大模型技術(shù)概述與行業(yè)應(yīng)用圖譜:了解大語言模型的發(fā)展歷程、核心定義與技術(shù)特征(參數(shù)規(guī)模、涌現(xiàn)能力、上下文學習)。學習大模型的主要分類:僅編碼器架構(gòu)(BERT)、僅解碼器架構(gòu)(GPT系列)、編碼器-解碼器架構(gòu)(T5、BART)的設(shè)計理念與適用場景差異。掌握大模型在金融、醫(yī)療、法律、教育、制造等行業(yè)的典型應(yīng)用場景與價值分析。分析大模型技術(shù)生態(tài)現(xiàn)狀與未來趨勢,包括主流模型選型策略。
(2)大模型能力邊界與選型策略:深入理解大模型的核心能力:自然語言理解、文本生成、代碼生成、邏輯推理、工具調(diào)用等。學習不同規(guī)模模型(7B、13B、70B)的性能特征與資源需求分析。掌握開源模型(Llama、Qwen、DeepSeek)與閉源模型(GPT-4、Claude)的對比選型方法。學習通過公開評測榜單(MMLU、HumanEval、CEval)評估模型能力。理解模型部署方式的選擇:云端API調(diào)用、本地私有化部署、混合部署的適用場景。
(3)提示詞工程與上下文學習:掌握提示詞(Prompt)的核心設(shè)計原則與高級技巧。學習思維鏈(Chain-of-Thought)、思維樹(Tree-of-Thoughts)引導模型展示推理過程的方法。掌握指令調(diào)優(yōu)方法論:逐步細化指令、設(shè)定約束條件、少樣本示例。了解結(jié)構(gòu)化提示、角色代入、多輪對話等復雜場景的設(shè)計策略。實踐構(gòu)建覆蓋常見應(yīng)用場景的Prompt模板庫。
(4)檢索增強生成(RAG)技術(shù):深入理解RAG的核心架構(gòu)(索引-檢索-增強-生成)及其在解決模型幻覺、知識時效性問題中的核心價值。學習RAG系統(tǒng)的完整工作流程:文檔加載、文本分塊、向量化、索引構(gòu)建、相似度檢索、提示詞增強、生成回答。掌握向量數(shù)據(jù)庫的核心概念與主流產(chǎn)品選型(FAISS、Chroma、Milvus、Qdrant)。學習混合檢索策略(稠密檢索+稀疏檢索BM25)與重排序(Re-ranking)技術(shù)的實現(xiàn)。實踐構(gòu)建基于企業(yè)知識庫的智能問答系統(tǒng)。
(5)智能體(Agent)技術(shù)應(yīng)用:掌握智能體的核心架構(gòu)(感知-規(guī)劃-記憶-執(zhí)行)及其自主決策能力。學習單智能體與多智能體系統(tǒng)的設(shè)計模式(ReAct、Reflection)。掌握工具調(diào)用機制(Function Calling/Tool Use)的實現(xiàn)方法,讓Agent執(zhí)行外部工具(代碼解釋器、API調(diào)用、數(shù)據(jù)庫查詢)。學習記憶管理策略:短期記憶(上下文窗口)與長期記憶(向量數(shù)據(jù)庫)結(jié)合。實踐使用LangGraph/CrewAI構(gòu)建多智能體協(xié)作系統(tǒng)(如客服智能體、數(shù)據(jù)分析智能體)。
(6)LangChain應(yīng)用開發(fā)框架:掌握LangChain框架的核心組件與使用方法。學習文檔加載器、文本分割器、向量存儲、檢索器、提示詞模板的鏈式組裝。深入理解Chains模塊:LLMChain、SimpleSequentialChain、SequentialChain、RouterChain。掌握Conversational Memory機制:ConversationBufferMemory、ConversationSummaryMemory、EntityMemory等。實踐使用LangChain構(gòu)建復雜對話系統(tǒng)。
(7)模型微調(diào)與領(lǐng)域適配:深入理解全參數(shù)微調(diào)與參數(shù)高效微調(diào)的適用場景差異。掌握LoRA(低秩適配)的核心原理:低秩矩陣分解、適配器矩陣設(shè)計、縮放系數(shù)配置。學習QLoRA的量化權(quán)重與梯度更新機制,實現(xiàn)在單GPU上微調(diào)大模型。學習微調(diào)數(shù)據(jù)集的準備與格式化(Alpaca格式、ShareGPT格式)。實踐使用LlamaFactory對開源模型進行垂直領(lǐng)域微調(diào)。
(8)金融行業(yè)大模型應(yīng)用:了解大模型在金融領(lǐng)域的核心應(yīng)用場景:智能投顧、研報分析、風險評估、合規(guī)審查、客服機器人。學習金融數(shù)據(jù)的特征與處理策略,掌握金融領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)金融研報智能分析助手,實現(xiàn)財報解讀、風險點識別、投資建議生成。
(9)醫(yī)療行業(yè)大模型應(yīng)用:了解大模型在醫(yī)療領(lǐng)域的核心應(yīng)用場景:智能問診、病歷分析、醫(yī)學文獻檢索、臨床決策支持、藥物研發(fā)。學習醫(yī)學數(shù)據(jù)的特征與處理策略(電子病歷、臨床指南、醫(yī)學文獻)。掌握醫(yī)療領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)醫(yī)學知識問答系統(tǒng),實現(xiàn)癥狀采集、疾病預測、診療建議生成。
(10)法律行業(yè)大模型應(yīng)用:了解大模型在法律領(lǐng)域的核心應(yīng)用場景:法律咨詢、合同審查、案例檢索、文書生成。學習法律數(shù)據(jù)的特征與處理策略(法律法規(guī)、裁判文書、合同模板)。掌握法律領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)法律咨詢助手,實現(xiàn)合同關(guān)鍵條款審查、法律問題解答。
(11)教育行業(yè)大模型應(yīng)用:了解大模型在教育領(lǐng)域的核心應(yīng)用場景:智能備課、個性化學習、自動出題、作業(yè)批改、虛擬教師。學習教育數(shù)據(jù)的特征與處理策略(教材、試題、學生問答記錄)。掌握教育領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)個性化學習輔導系統(tǒng),實現(xiàn)知識點講解、題目生成、學習路徑規(guī)劃。
(12)綜合項目實戰(zhàn):行業(yè)大模型應(yīng)用系統(tǒng)開發(fā):結(jié)合學員專業(yè)背景,完成一個完整的行業(yè)大模型應(yīng)用項目(如金融投研助手、醫(yī)療問診系統(tǒng)、法律咨詢機器人、教育輔導平臺)。涵蓋需求分析、技術(shù)方案設(shè)計、模型選型、數(shù)據(jù)工程、RAG系統(tǒng)構(gòu)建、智能體開發(fā)、應(yīng)用集成、性能優(yōu)化與部署上線的全流程,形成規(guī)范的行業(yè)大模型應(yīng)用項目報告。<|end▁of▁thinking|>### 大模型技術(shù)應(yīng)用培訓課程大綱
-
培訓對象:適合具備Python編程基礎(chǔ),了解機器學習基本概念,希望系統(tǒng)掌握大模型技術(shù)在各行業(yè)應(yīng)用落地能力的算法工程師、AI應(yīng)用開發(fā)者、技術(shù)架構(gòu)師、產(chǎn)品經(jīng)理及計算機相關(guān)專業(yè)學生。
-
培訓目標:完成本課程后,學員將能夠深入理解大語言模型的核心技術(shù)原理與能力邊界,熟練掌握大模型應(yīng)用開發(fā)的完整技術(shù)棧,包括提示詞工程、檢索增強生成(RAG)、智能體(Agent)開發(fā)、模型微調(diào)等關(guān)鍵技術(shù),具備將大模型技術(shù)應(yīng)用于金融、醫(yī)療、法律、教育等垂直領(lǐng)域的工程能力,能夠獨立完成從業(yè)務(wù)需求分析、技術(shù)方案設(shè)計到應(yīng)用開發(fā)部署的完整項目交付。
-
培訓內(nèi)容:
(1)大模型技術(shù)概述與行業(yè)應(yīng)用圖譜:了解大語言模型的發(fā)展歷程、核心定義與技術(shù)特征(參數(shù)規(guī)模、涌現(xiàn)能力、上下文學習)。學習大模型的主要分類:僅編碼器架構(gòu)(BERT)、僅解碼器架構(gòu)(GPT系列)、編碼器-解碼器架構(gòu)(T5、BART)的設(shè)計理念與適用場景差異。掌握大模型在金融、醫(yī)療、法律、教育、制造等行業(yè)的典型應(yīng)用場景與價值分析。分析大模型技術(shù)生態(tài)現(xiàn)狀與未來趨勢,包括主流模型選型策略。
(2)大模型能力邊界與選型策略:深入理解大模型的核心能力:自然語言理解、文本生成、代碼生成、邏輯推理、工具調(diào)用等。學習不同規(guī)模模型(7B、13B、70B)的性能特征與資源需求分析。掌握開源模型(Llama、Qwen、DeepSeek)與閉源模型(GPT-4、Claude)的對比選型方法。學習通過公開評測榜單(MMLU、HumanEval、CEval)評估模型能力。理解模型部署方式的選擇:云端API調(diào)用、本地私有化部署、混合部署的適用場景。
(3)提示詞工程與上下文學習:掌握提示詞(Prompt)的核心設(shè)計原則與高級技巧。學習思維鏈(Chain-of-Thought)、思維樹(Tree-of-Thoughts)引導模型展示推理過程的方法。掌握指令調(diào)優(yōu)方法論:逐步細化指令、設(shè)定約束條件、少樣本示例。了解結(jié)構(gòu)化提示、角色代入、多輪對話等復雜場景的設(shè)計策略。實踐構(gòu)建覆蓋常見應(yīng)用場景的Prompt模板庫。
(4)檢索增強生成(RAG)技術(shù):深入理解RAG的核心架構(gòu)(索引-檢索-增強-生成)及其在解決模型幻覺、知識時效性問題中的核心價值。學習RAG系統(tǒng)的完整工作流程:文檔加載、文本分塊、向量化、索引構(gòu)建、相似度檢索、提示詞增強、生成回答。掌握向量數(shù)據(jù)庫的核心概念與主流產(chǎn)品選型(FAISS、Chroma、Milvus、Qdrant)。學習混合檢索策略(稠密檢索+稀疏檢索BM25)與重排序(Re-ranking)技術(shù)的實現(xiàn)。實踐構(gòu)建基于企業(yè)知識庫的智能問答系統(tǒng)。
(5)智能體(Agent)技術(shù)應(yīng)用:掌握智能體的核心架構(gòu)(感知-規(guī)劃-記憶-執(zhí)行)及其自主決策能力。學習單智能體與多智能體系統(tǒng)的設(shè)計模式(ReAct、Reflection)。掌握工具調(diào)用機制(Function Calling/Tool Use)的實現(xiàn)方法,讓Agent執(zhí)行外部工具(代碼解釋器、API調(diào)用、數(shù)據(jù)庫查詢)。學習記憶管理策略:短期記憶(上下文窗口)與長期記憶(向量數(shù)據(jù)庫)結(jié)合。實踐使用LangGraph/CrewAI構(gòu)建多智能體協(xié)作系統(tǒng)(如客服智能體、數(shù)據(jù)分析智能體)。
(6)LangChain應(yīng)用開發(fā)框架:掌握LangChain框架的核心組件與使用方法。學習文檔加載器、文本分割器、向量存儲、檢索器、提示詞模板的鏈式組裝。深入理解Chains模塊:LLMChain、SimpleSequentialChain、SequentialChain、RouterChain。掌握Conversational Memory機制:ConversationBufferMemory、ConversationSummaryMemory、EntityMemory等。實踐使用LangChain構(gòu)建復雜對話系統(tǒng)。
(7)模型微調(diào)與領(lǐng)域適配:深入理解全參數(shù)微調(diào)與參數(shù)高效微調(diào)的適用場景差異。掌握LoRA(低秩適配)的核心原理:低秩矩陣分解、適配器矩陣設(shè)計、縮放系數(shù)配置。學習QLoRA的量化權(quán)重與梯度更新機制,實現(xiàn)在單GPU上微調(diào)大模型。學習微調(diào)數(shù)據(jù)集的準備與格式化(Alpaca格式、ShareGPT格式)。實踐使用LlamaFactory對開源模型進行垂直領(lǐng)域微調(diào)。
(8)金融行業(yè)大模型應(yīng)用:了解大模型在金融領(lǐng)域的核心應(yīng)用場景:智能投顧、研報分析、風險評估、合規(guī)審查、客服機器人。學習金融數(shù)據(jù)的特征與處理策略,掌握金融領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)金融研報智能分析助手,實現(xiàn)財報解讀、風險點識別、投資建議生成。
(9)醫(yī)療行業(yè)大模型應(yīng)用:了解大模型在醫(yī)療領(lǐng)域的核心應(yīng)用場景:智能問診、病歷分析、醫(yī)學文獻檢索、臨床決策支持、藥物研發(fā)。學習醫(yī)學數(shù)據(jù)的特征與處理策略(電子病歷、臨床指南、醫(yī)學文獻)。掌握醫(yī)療領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)醫(yī)學知識問答系統(tǒng),實現(xiàn)癥狀采集、疾病預測、診療建議生成。
(10)法律行業(yè)大模型應(yīng)用:了解大模型在法律領(lǐng)域的核心應(yīng)用場景:法律咨詢、合同審查、案例檢索、文書生成。學習法律數(shù)據(jù)的特征與處理策略(法律法規(guī)、裁判文書、合同模板)。掌握法律領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)法律咨詢助手,實現(xiàn)合同關(guān)鍵條款審查、法律問題解答。
(11)教育行業(yè)大模型應(yīng)用:了解大模型在教育領(lǐng)域的核心應(yīng)用場景:智能備課、個性化學習、自動出題、作業(yè)批改、虛擬教師。學習教育數(shù)據(jù)的特征與處理策略(教材、試題、學生問答記錄)。掌握教育領(lǐng)域知識庫的構(gòu)建方法。實踐開發(fā)個性化學習輔導系統(tǒng),實現(xiàn)知識點講解、題目生成、學習路徑規(guī)劃。
(12)綜合項目實戰(zhàn):行業(yè)大模型應(yīng)用系統(tǒng)開發(fā):結(jié)合學員專業(yè)背景,完成一個完整的行業(yè)大模型應(yīng)用項目(如金融投研助手、醫(yī)療問診系統(tǒng)、法律咨詢機器人、教育輔導平臺)。涵蓋需求分析、技術(shù)方案設(shè)計、模型選型、數(shù)據(jù)工程、RAG系統(tǒng)構(gòu)建、智能體開發(fā)、應(yīng)用集成、性能優(yōu)化與部署上線的全流程,形成規(guī)范的行業(yè)大模型應(yīng)用項目報告。