RAG應(yīng)用開發(fā)培訓(xùn)課程大綱
培訓(xùn)對象:
-
具備Python基礎(chǔ)的AI應(yīng)用開發(fā)工程師
-
希望構(gòu)建企業(yè)知識庫問答系統(tǒng)的技術(shù)負(fù)責(zé)人
-
需要解決大模型幻覺問題的算法工程師
-
智能客服/文檔問答/企業(yè)搜索系統(tǒng)開發(fā)者
培訓(xùn)目標(biāo):
使學(xué)員系統(tǒng)掌握RAG(檢索增強生成)技術(shù)的核心原理與完整開發(fā)流程,從基礎(chǔ)架構(gòu)到高級優(yōu)化;熟練使用LangChain、LlamaIndex等主流框架構(gòu)建RAG應(yīng)用;深入理解文檔加載、切片、嵌入、檢索、重排序、生成的全鏈路設(shè)計與調(diào)優(yōu);掌握RAG系統(tǒng)評估方法與生產(chǎn)級部署策略;能夠獨立開發(fā)企業(yè)知識庫問答、智能文檔處理等生產(chǎn)級RAG應(yīng)用,有效解決大模型幻覺問題,提升回答準(zhǔn)確性與可解釋性。
培訓(xùn)內(nèi)容介紹:
-
RAG技術(shù)原理與企業(yè)應(yīng)用價值
大模型的局限性:知識截止日期、幻覺問題、無法處理私有數(shù)據(jù);RAG核心思想:檢索+生成雙階段架構(gòu);RAG的技術(shù)演進(jìn):Naive RAG → Advanced RAG → Modular RAG;RAG vs 微調(diào) vs 長上下文的技術(shù)選型對比;RAG在企業(yè)知識庫、智能客服、文檔分析等場景的應(yīng)用價值。
-
RAG應(yīng)用架構(gòu)與技術(shù)棧全景
標(biāo)準(zhǔn)RAG架構(gòu)詳解:索引階段(Indexing) + 檢索階段(Retrieval) + 生成階段(Generation);RAG應(yīng)用模塊拆解:文檔加載器、文本分割器、嵌入模型、向量數(shù)據(jù)庫、檢索器、提示模板、大模型;主流開發(fā)框架對比:LangChain vs LlamaIndex;RAG開發(fā)環(huán)境搭建與工具鏈配置。
-
文檔加載與解析技術(shù)
多格式文檔加載器:PDF(PyPDF/PyMuPDF/PDFPlumber)、Word(python-docx)、Excel(pandas/openpyxl)、PPT(python-pptx)、HTML(BeautifulSoup)、Markdown;復(fù)雜文檔處理:表格提取、圖片OCR(Tesseract/EasyOCR)、掃描件解析;網(wǎng)頁抓取與處理:爬蟲基礎(chǔ)、HTML內(nèi)容清洗;非結(jié)構(gòu)化數(shù)據(jù)解析挑戰(zhàn)與解決方案。
-
文本分割(Chunking)策略與優(yōu)化
文本分割的核心挑戰(zhàn):保持語義完整性 vs 控制塊大。换A(chǔ)分割策略:按字符數(shù)/按段落/按遞歸字符;語義分割:基于句子邊界、基于文檔結(jié)構(gòu)(Markdown標(biāo)題/HTML標(biāo)簽);高級分割:基于Embedding的語義聚類;不同文檔類型(代碼/表格/長文)的最佳分割實踐;塊大小與重疊(Overlap)參數(shù)的實驗調(diào)優(yōu)。
-
嵌入模型(Embedding)與向量化
嵌入模型原理:將文本映射到語義向量空間;主流嵌入模型對比:OpenAI嵌入/BGE/M3E/GTE/text2vec;多語言嵌入模型選擇(中文場景);嵌入模型的本地部署與微調(diào);批量向量化與異步處理;嵌入緩存策略提升性能。
-
向量數(shù)據(jù)庫選型與索引構(gòu)建
向量數(shù)據(jù)庫核心能力:相似性搜索、混合搜索、元數(shù)據(jù)過濾;主流向量數(shù)據(jù)庫對比:FAISS(本地)/Chroma(輕量)/Milvus(分布式)/PGVector(PostgreSQL擴(kuò)展)/Qdrant/Elasticsearch;向量索引類型:FLAT/IVF/HNSW;索引參數(shù)調(diào)優(yōu):查詢速度與召回率的平衡;向量數(shù)據(jù)庫的部署模式:嵌入式 vs 服務(wù)化。
-
檢索策略與召回優(yōu)化
基礎(chǔ)檢索:相似度檢索(余弦相似度/歐氏距離/點積);混合檢索:BM25全文檢索+向量檢索的加權(quán)融合;多路召回策略:從不同索引/不同字段并行召回;元數(shù)據(jù)過濾:基于文檔來源/時間/類別的精準(zhǔn)篩選;檢索參數(shù)調(diào)優(yōu):召回數(shù)量(top-k)與相似度閾值設(shè)置;檢索結(jié)果的多樣性提升。
-
重排序(Re-ranking)技術(shù)
為什么需要重排序:向量檢索的局限性;重排序模型原理:Cross-Encoder vs Bi-Encoder;主流重排序模型:Cohere Rerank/BGE Reranker;重排序在RAG流程中的位置:檢索后、生成前;重排序效果評估與性能開銷平衡;上下文窗口管理與重排序結(jié)果截斷。
-
提示工程與查詢優(yōu)化
RAG場景下的提示詞設(shè)計原則:上下文注入+任務(wù)指令+格式約束;多輪對話中的上下文管理;查詢重寫(Query Rewriting):原始問題的分解與擴(kuò)展;查詢路由:根據(jù)問題類型選擇不同知識庫;HyDE(Hypothetical Document Embeddings)技術(shù):先生成假設(shè)文檔再檢索。
-
RAG系統(tǒng)評估與優(yōu)化
RAG評估的挑戰(zhàn):生成質(zhì)量+檢索質(zhì)量雙重維度;RAG評估框架:RAGAS(Context Relevancy/Answer Faithfulness/Answer Relevance)、TruLens;檢索質(zhì)量指標(biāo):命中率(Hit Rate)/平均倒數(shù)排名(MRR)/歸一化折損累積增益(NDCG);生成質(zhì)量指標(biāo):忠實度/相關(guān)性/有用性;構(gòu)建人工評估集與自動化測試流水線;RAG系統(tǒng)的持續(xù)優(yōu)化閉環(huán)。
-
生產(chǎn)級RAG應(yīng)用部署
高性能RAG架構(gòu)設(shè)計:異步處理、緩存策略、并發(fā)控制;流式輸出實現(xiàn):Server-Sent Events(SSE)與WebSocket;RAG服務(wù)API封裝(FastAPI);容器化部署(Docker + Kubernetes);向量數(shù)據(jù)庫的高可用與備份;RAG系統(tǒng)的可觀測性:鏈路追蹤、指標(biāo)監(jiān)控、日志采集;成本優(yōu)化策略:Token用量監(jiān)控與緩存命中率提升。
-
綜合實戰(zhàn):企業(yè)級知識庫問答系統(tǒng)開發(fā)
從零構(gòu)建一個完整的企業(yè)級RAG應(yīng)用:
-
需求分析:企業(yè)內(nèi)部文檔/政策/產(chǎn)品資料的智能問答場景
-
文檔處理流水線:支持多格式文檔上傳(PDF/Word/Excel),實現(xiàn)自動解析、智能分塊、向量化存儲
-
檢索優(yōu)化:實現(xiàn)混合檢索(BM25+向量)+重排序,提升召回準(zhǔn)確率
-
多輪對話設(shè)計:基于歷史上下文的問題重寫與意圖保持
-
引用溯源:答案生成的同時返回參考文檔來源,增強可信度
-
管理后臺:知識庫版本管理、問答效果監(jiān)控、人工標(biāo)注優(yōu)化
-
效果評估:構(gòu)建測試集,使用RAGAS評估系統(tǒng)性能
-
性能優(yōu)化:引入Embedding緩存、并行檢索、流式輸出
-
部署上線:Docker容器化+K8s部署,配置監(jiān)控告警
-
成果交付:可交互的企業(yè)知識庫問答系統(tǒng),支持多用戶、多知識庫隔離
課程特色:
-
原理深度:深入剖析RAG各環(huán)節(jié)的技術(shù)原理與設(shè)計哲學(xué),不僅教“怎么做”,更教“為什么”
-
全鏈路覆蓋:從文檔加載、切片、嵌入、檢索、重排序到生成,完整覆蓋RAG全流程
-
實戰(zhàn)驅(qū)動:基于真實企業(yè)文檔數(shù)據(jù),手把手構(gòu)建生產(chǎn)級RAG應(yīng)用
-
效果導(dǎo)向:強調(diào)評估與優(yōu)化方法,確保RAG系統(tǒng)真正好用、可用
-
工程思維:融入生產(chǎn)環(huán)境部署考量,培養(yǎng)學(xué)員的工程化落地能力
如果您想學(xué)習(xí)本課程,請
預(yù)約報名
如果沒找到合適的課程或有特殊培訓(xùn)需求,請
訂制培訓(xùn)
除培訓(xùn)外,同時提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表點擊在線申請
服務(wù)特點:
海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項目專家,針對實際需求,顧問式咨詢,互動式授課,案例教學(xué),小班授課,實際項目演示,快捷高效,省時省力省錢。
專家力量:
中國科學(xué)院軟件研究所,計算研究所高級研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級工程師,項目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富
多年實際項目經(jīng)歷,大型項目實戰(zhàn)案例,熱情,樂于技術(shù)分享
針對客戶實際需求,案例教學(xué),互動式溝通,學(xué)有所獲