美女国产精品,香蕉人妻AV在线看,日韩1区手机在线观看,日本精品二区,在线伊人青青国产,国产激情四射夜夜,91人妻福利久久视频,日韩精品亚洲香蕉,在线99第一页

課程培訓(xùn)
RAG應(yīng)用開發(fā)培訓(xùn)課程

RAG應(yīng)用開發(fā)培訓(xùn)課程大綱

 

培訓(xùn)對象

  • 具備Python基礎(chǔ)的AI應(yīng)用開發(fā)工程師

  • 希望構(gòu)建企業(yè)知識庫問答系統(tǒng)的技術(shù)負(fù)責(zé)人

  • 需要解決大模型幻覺問題的算法工程師

  • 智能客服/文檔問答/企業(yè)搜索系統(tǒng)開發(fā)者

 

培訓(xùn)目標(biāo)
使學(xué)員系統(tǒng)掌握RAG(檢索增強生成)技術(shù)的核心原理與完整開發(fā)流程,從基礎(chǔ)架構(gòu)到高級優(yōu)化;熟練使用LangChain、LlamaIndex等主流框架構(gòu)建RAG應(yīng)用;深入理解文檔加載、切片、嵌入、檢索、重排序、生成的全鏈路設(shè)計與調(diào)優(yōu);掌握RAG系統(tǒng)評估方法與生產(chǎn)級部署策略;能夠獨立開發(fā)企業(yè)知識庫問答、智能文檔處理等生產(chǎn)級RAG應(yīng)用,有效解決大模型幻覺問題,提升回答準(zhǔn)確性與可解釋性。

 

培訓(xùn)內(nèi)容介紹

  1. RAG技術(shù)原理與企業(yè)應(yīng)用價值
    大模型的局限性:知識截止日期、幻覺問題、無法處理私有數(shù)據(jù);RAG核心思想:檢索+生成雙階段架構(gòu);RAG的技術(shù)演進(jìn):Naive RAG → Advanced RAG → Modular RAG;RAG vs 微調(diào) vs 長上下文的技術(shù)選型對比;RAG在企業(yè)知識庫、智能客服、文檔分析等場景的應(yīng)用價值。

  2. RAG應(yīng)用架構(gòu)與技術(shù)棧全景
    標(biāo)準(zhǔn)RAG架構(gòu)詳解:索引階段(Indexing) + 檢索階段(Retrieval) + 生成階段(Generation);RAG應(yīng)用模塊拆解:文檔加載器、文本分割器、嵌入模型、向量數(shù)據(jù)庫、檢索器、提示模板、大模型;主流開發(fā)框架對比:LangChain vs LlamaIndex;RAG開發(fā)環(huán)境搭建與工具鏈配置。

  3. 文檔加載與解析技術(shù)
    多格式文檔加載器:PDF(PyPDF/PyMuPDF/PDFPlumber)、Word(python-docx)、Excel(pandas/openpyxl)、PPT(python-pptx)、HTML(BeautifulSoup)、Markdown;復(fù)雜文檔處理:表格提取、圖片OCR(Tesseract/EasyOCR)、掃描件解析;網(wǎng)頁抓取與處理:爬蟲基礎(chǔ)、HTML內(nèi)容清洗;非結(jié)構(gòu)化數(shù)據(jù)解析挑戰(zhàn)與解決方案。

  4. 文本分割(Chunking)策略與優(yōu)化
    文本分割的核心挑戰(zhàn):保持語義完整性 vs 控制塊大。换A(chǔ)分割策略:按字符數(shù)/按段落/按遞歸字符;語義分割:基于句子邊界、基于文檔結(jié)構(gòu)(Markdown標(biāo)題/HTML標(biāo)簽);高級分割:基于Embedding的語義聚類;不同文檔類型(代碼/表格/長文)的最佳分割實踐;塊大小與重疊(Overlap)參數(shù)的實驗調(diào)優(yōu)。

  5. 嵌入模型(Embedding)與向量化
    嵌入模型原理:將文本映射到語義向量空間;主流嵌入模型對比:OpenAI嵌入/BGE/M3E/GTE/text2vec;多語言嵌入模型選擇(中文場景);嵌入模型的本地部署與微調(diào);批量向量化與異步處理;嵌入緩存策略提升性能。

  6. 向量數(shù)據(jù)庫選型與索引構(gòu)建
    向量數(shù)據(jù)庫核心能力:相似性搜索、混合搜索、元數(shù)據(jù)過濾;主流向量數(shù)據(jù)庫對比:FAISS(本地)/Chroma(輕量)/Milvus(分布式)/PGVector(PostgreSQL擴(kuò)展)/Qdrant/Elasticsearch;向量索引類型:FLAT/IVF/HNSW;索引參數(shù)調(diào)優(yōu):查詢速度與召回率的平衡;向量數(shù)據(jù)庫的部署模式:嵌入式 vs 服務(wù)化。

  7. 檢索策略與召回優(yōu)化
    基礎(chǔ)檢索:相似度檢索(余弦相似度/歐氏距離/點積);混合檢索:BM25全文檢索+向量檢索的加權(quán)融合;多路召回策略:從不同索引/不同字段并行召回;元數(shù)據(jù)過濾:基于文檔來源/時間/類別的精準(zhǔn)篩選;檢索參數(shù)調(diào)優(yōu):召回數(shù)量(top-k)與相似度閾值設(shè)置;檢索結(jié)果的多樣性提升。

  8. 重排序(Re-ranking)技術(shù)
    為什么需要重排序:向量檢索的局限性;重排序模型原理:Cross-Encoder vs Bi-Encoder;主流重排序模型:Cohere Rerank/BGE Reranker;重排序在RAG流程中的位置:檢索后、生成前;重排序效果評估與性能開銷平衡;上下文窗口管理與重排序結(jié)果截斷。

  9. 提示工程與查詢優(yōu)化
    RAG場景下的提示詞設(shè)計原則:上下文注入+任務(wù)指令+格式約束;多輪對話中的上下文管理;查詢重寫(Query Rewriting):原始問題的分解與擴(kuò)展;查詢路由:根據(jù)問題類型選擇不同知識庫;HyDE(Hypothetical Document Embeddings)技術(shù):先生成假設(shè)文檔再檢索。

  10. RAG系統(tǒng)評估與優(yōu)化
    RAG評估的挑戰(zhàn):生成質(zhì)量+檢索質(zhì)量雙重維度;RAG評估框架:RAGAS(Context Relevancy/Answer Faithfulness/Answer Relevance)、TruLens;檢索質(zhì)量指標(biāo):命中率(Hit Rate)/平均倒數(shù)排名(MRR)/歸一化折損累積增益(NDCG);生成質(zhì)量指標(biāo):忠實度/相關(guān)性/有用性;構(gòu)建人工評估集與自動化測試流水線;RAG系統(tǒng)的持續(xù)優(yōu)化閉環(huán)。

  11. 生產(chǎn)級RAG應(yīng)用部署
    高性能RAG架構(gòu)設(shè)計:異步處理、緩存策略、并發(fā)控制;流式輸出實現(xiàn):Server-Sent Events(SSE)與WebSocket;RAG服務(wù)API封裝(FastAPI);容器化部署(Docker + Kubernetes);向量數(shù)據(jù)庫的高可用與備份;RAG系統(tǒng)的可觀測性:鏈路追蹤、指標(biāo)監(jiān)控、日志采集;成本優(yōu)化策略:Token用量監(jiān)控與緩存命中率提升。

  12. 綜合實戰(zhàn):企業(yè)級知識庫問答系統(tǒng)開發(fā)
    從零構(gòu)建一個完整的企業(yè)級RAG應(yīng)用:

    • 需求分析:企業(yè)內(nèi)部文檔/政策/產(chǎn)品資料的智能問答場景

    • 文檔處理流水線:支持多格式文檔上傳(PDF/Word/Excel),實現(xiàn)自動解析、智能分塊、向量化存儲

    • 檢索優(yōu)化:實現(xiàn)混合檢索(BM25+向量)+重排序,提升召回準(zhǔn)確率

    • 多輪對話設(shè)計:基于歷史上下文的問題重寫與意圖保持

    • 引用溯源:答案生成的同時返回參考文檔來源,增強可信度

    • 管理后臺:知識庫版本管理、問答效果監(jiān)控、人工標(biāo)注優(yōu)化

    • 效果評估:構(gòu)建測試集,使用RAGAS評估系統(tǒng)性能

    • 性能優(yōu)化:引入Embedding緩存、并行檢索、流式輸出

    • 部署上線:Docker容器化+K8s部署,配置監(jiān)控告警

    • 成果交付:可交互的企業(yè)知識庫問答系統(tǒng),支持多用戶、多知識庫隔離


課程特色

  • 原理深度:深入剖析RAG各環(huán)節(jié)的技術(shù)原理與設(shè)計哲學(xué),不僅教“怎么做”,更教“為什么”

  • 全鏈路覆蓋:從文檔加載、切片、嵌入、檢索、重排序到生成,完整覆蓋RAG全流程

  • 實戰(zhàn)驅(qū)動:基于真實企業(yè)文檔數(shù)據(jù),手把手構(gòu)建生產(chǎn)級RAG應(yīng)用

  • 效果導(dǎo)向:強調(diào)評估與優(yōu)化方法,確保RAG系統(tǒng)真正好用、可用

  • 工程思維:融入生產(chǎn)環(huán)境部署考量,培養(yǎng)學(xué)員的工程化落地能力





如果您想學(xué)習(xí)本課程,請預(yù)約報名
如果沒找到合適的課程或有特殊培訓(xùn)需求,請訂制培訓(xùn)
除培訓(xùn)外,同時提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表點擊在線申請

服務(wù)特點:
海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項目專家,針對實際需求,顧問式咨詢,互動式授課,案例教學(xué),小班授課,實際項目演示,快捷高效,省時省力省錢。

專家力量:
中國科學(xué)院軟件研究所,計算研究所高級研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級工程師,項目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富
多年實際項目經(jīng)歷,大型項目實戰(zhàn)案例,熱情,樂于技術(shù)分享
針對客戶實際需求,案例教學(xué),互動式溝通,學(xué)有所獲
聯(lián)系我們 更多>>

咨詢電話010-62883247

                4007991916

咨詢郵箱:soft@info-soft.cn  

 

  微信咨詢

隨時聽講課

聚焦技術(shù)實踐

訂制培訓(xùn) 更多>>
仙居县| 余干县| 明溪县| 全州县| 吉隆县| 兰州市| 新乡市| 永靖县| 抚顺县| 丹巴县| 壤塘县| 安义县| 隆安县| 中江县| 稷山县| 石狮市| 吴川市| 神农架林区| 舟曲县| 罗城| 西城区| 侯马市| 台东县| 澄迈县| 宁远县| 抚州市| 家居| 榕江县| 梓潼县| 江阴市| 吉木萨尔县| 兴义市| 虎林市| 西华县| 宁晋县| 克什克腾旗| 禹城市| 余姚市| 明光市| 双城市| 桂东县|