AI安全治理 —— 大模型安全與合規(guī)實(shí)戰(zhàn)培訓(xùn)課程
一、培訓(xùn)對(duì)象
AI安全工程師、安全架構(gòu)師、合規(guī)與風(fēng)控人員、法務(wù)與治理人員、模型安全評(píng)估人員
二、培訓(xùn)目標(biāo)
-
掌握大模型安全風(fēng)險(xiǎn)識(shí)別、評(píng)估與防御的核心能力
-
建立覆蓋數(shù)據(jù)、模型、應(yīng)用、合規(guī)的全鏈路安全治理體系
-
具備開展自動(dòng)化紅隊(duì)測試、對(duì)抗性評(píng)估與安全微調(diào)的實(shí)戰(zhàn)能力
-
能夠主導(dǎo)企業(yè)級(jí)AI安全治理體系建設(shè)與合規(guī)落地
三、培訓(xùn)內(nèi)容
1. 大模型安全風(fēng)險(xiǎn)全景
-
大模型安全風(fēng)險(xiǎn)分類框架(OWASP LLM Top 10、MITRE ATLAS)
-
內(nèi)生安全風(fēng)險(xiǎn):幻覺、偏見、有害內(nèi)容、越獄、提示詞注入
-
外延安全風(fēng)險(xiǎn):數(shù)據(jù)泄露、供應(yīng)鏈攻擊、濫用與誤用
-
新興風(fēng)險(xiǎn):Agent安全、多模態(tài)安全、長上下文注入
2. 提示詞注入與越獄攻擊
-
提示詞注入的原理與變種(直接注入、間接注入、嵌套注入)
-
越獄攻擊手法:DAN、角色扮演、編碼繞過、token走私
-
多模態(tài)越獄(圖像、音頻注入)的威脅與防御
3. 對(duì)抗性防御策略
-
輸入過濾機(jī)制:提示詞檢測器、敏感詞過濾、格式驗(yàn)證
-
輸出審核機(jī)制:內(nèi)容分類器、拒答檢測、安全評(píng)分
-
系統(tǒng)性防御:系統(tǒng)提示詞加固、護(hù)欄規(guī)則引擎、沙箱隔離
4. 安全微調(diào)與對(duì)齊強(qiáng)化
-
安全對(duì)齊數(shù)據(jù)集構(gòu)建(有害內(nèi)容、偏見、越獄樣本)
-
基于RLHF/DPO的安全對(duì)齊強(qiáng)化訓(xùn)練
-
安全微調(diào)的效果評(píng)估與魯棒性測試
5. 數(shù)據(jù)隱私與版權(quán)治理
-
訓(xùn)練數(shù)據(jù)隱私風(fēng)險(xiǎn):成員推斷、數(shù)據(jù)反演、隱私泄露
-
差分隱私(DP)在微調(diào)中的應(yīng)用
-
版權(quán)合規(guī)治理:數(shù)據(jù)來源追溯、水印技術(shù)、版權(quán)聲明機(jī)制
6. 內(nèi)容風(fēng)控與價(jià)值觀對(duì)齊
-
多維度敏感內(nèi)容分類體系(涉政、色情、暴力、歧視、偏見)
-
動(dòng)態(tài)敏感詞庫與上下文語義檢測
-
社會(huì)主義核心價(jià)值觀對(duì)齊的工程實(shí)現(xiàn)與評(píng)估
7. 自動(dòng)化紅隊(duì)測試
8. 模型安全評(píng)估體系
-
安全評(píng)估指標(biāo)框架(魯棒性、真實(shí)性、公平性、安全性)
-
標(biāo)準(zhǔn)化評(píng)估基準(zhǔn)(SafetyBench、CValues、Do-Not-Answer)
-
自動(dòng)化評(píng)估流水線與模型安全評(píng)分卡
9. Agent安全與工具調(diào)用安全
-
Agent系統(tǒng)的獨(dú)特安全風(fēng)險(xiǎn):規(guī)劃誤導(dǎo)、工具濫用、權(quán)限越界
-
工具調(diào)用安全設(shè)計(jì):工具白名單、參數(shù)校驗(yàn)、操作審計(jì)
-
多Agent協(xié)作中的安全風(fēng)險(xiǎn)與防護(hù)
10. RAG系統(tǒng)安全設(shè)計(jì)
-
向量數(shù)據(jù)庫安全:訪問控制、數(shù)據(jù)加密、隔離策略
-
檢索內(nèi)容安全:敏感文檔攔截、檢索結(jié)果過濾
-
檢索增強(qiáng)的安全風(fēng)險(xiǎn):檢索中毒、對(duì)抗性檢索
11. 合規(guī)治理與監(jiān)管應(yīng)對(duì)
-
《生成式人工智能服務(wù)管理暫行辦法》等國內(nèi)外法規(guī)解讀
-
算法備案、安全評(píng)估、合規(guī)審計(jì)的流程與材料準(zhǔn)備
-
跨境數(shù)據(jù)傳輸與境外合規(guī)要點(diǎn)
12. 安全事件響應(yīng)與治理體系
-
安全事件分類分級(jí)與應(yīng)急響應(yīng)流程
-
模型熔斷機(jī)制:一鍵熔斷、動(dòng)態(tài)降級(jí)、版本回滾
-
安全治理組織架構(gòu)、制度流程與文化構(gòu)建
-
安全左移:在AI開發(fā)全生命周期嵌入安全控制點(diǎn)
如果您想學(xué)習(xí)本課程,請(qǐng)
預(yù)約報(bào)名
如果沒找到合適的課程或有特殊培訓(xùn)需求,請(qǐng)
訂制培訓(xùn)
除培訓(xùn)外,同時(shí)提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請(qǐng)發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表點(diǎn)擊在線申請(qǐng)
服務(wù)特點(diǎn):
海量專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項(xiàng)目專家,針對(duì)實(shí)際需求,顧問式咨詢,互動(dòng)式授課,案例教學(xué),小班授課,實(shí)際項(xiàng)目演示,快捷高效,省時(shí)省力省錢。
專家力量:
中國科學(xué)院軟件研究所,計(jì)算研究所高級(jí)研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達(dá)索等大型公司高級(jí)工程師,項(xiàng)目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)技術(shù)專業(yè),理論素養(yǎng)豐富
多年實(shí)際項(xiàng)目經(jīng)歷,大型項(xiàng)目實(shí)戰(zhàn)案例,熱情,樂于技術(shù)分享
針對(duì)客戶實(shí)際需求,案例教學(xué),互動(dòng)式溝通,學(xué)有所獲