(1)知識圖譜概論與技術(shù)架構(gòu):了解知識圖譜的起源與發(fā)展歷程(從經(jīng)典人工智能知識工程到語義Web,再到現(xiàn)代知識圖譜)。理解知識圖譜的核心價值(語義搜索、智能問答、推薦計算、大數(shù)據(jù)分析)和知識圖譜分類(通用知識圖譜與領(lǐng)域知識圖譜)。掌握知識圖譜的整體技術(shù)架構(gòu),從底層圖數(shù)據(jù)庫到D2R/NL2R數(shù)據(jù)入圖再到圖譜消費應用的全流程。
(2)知識表示方法與OWL本體建模:理解知識表示的核心概念,學習人工智能歷史發(fā)展中的知識表示方法(產(chǎn)生式表示、框架表示、語義網(wǎng)絡)。掌握知識圖譜的符號表示方法(RDF、RDFS、OWL本體語言),學習知識圖譜的向量表示方法(TransE等知識表示學習模型)。深入理解本體(Ontology)的核心概念(類、屬性、關(guān)系、約束),掌握使用Protégé工具構(gòu)建OWL本體的完整流程,包括類層次結(jié)構(gòu)設計、對象/數(shù)據(jù)屬性定義、限制條件添加和公理設置。理解開放世界假設與封閉世界假設的區(qū)別,掌握必要條件和充分條件的建模技巧。
(3)知識圖譜全生命周期管理:掌握知識圖譜生命周期的核心概念,從知識建模、知識獲取、知識融合、知識存儲、知識計算到知識應用的全流程。理解各階段所需解決的相關(guān)問題與技術(shù)難點,建立知識圖譜項目的系統(tǒng)工程觀。
(4)知識抽。簩嶓w識別與關(guān)系抽取:學習非結(jié)構(gòu)化文本中的知識抽取技術(shù)。掌握實體識別(命名實體識別、細粒度實體識別)的方法,學習關(guān)系抽。ㄏ薅ㄓ蜿P(guān)系抽取、開放域關(guān)系抽。┑膶崿F(xiàn)。掌握基于深度學習的關(guān)系抽取主流模型(SPO抽取模型),包括基于序列標注的SPO模型設計和基于意圖識別+槽位抽取的SPO模型設計。了解概念抽取和事件識別與抽取技術(shù)。
(5)領(lǐng)域短語挖掘與同義詞挖掘:掌握領(lǐng)域短語挖掘的算法和統(tǒng)計指標,學習同義詞挖掘和縮略詞抽取的實現(xiàn)方法。理解實體消歧的核心問題(同名實體區(qū)分),掌握基于聚類的實體消歧方法和基于鏈接的實體消歧方法,學習實體鏈接技術(shù)將文本中的提及映射到知識庫中的目標實體。
(6)知識融合與實體對齊:理解知識圖譜融合的必要性和挑戰(zhàn)。掌握概念層融合技術(shù)(本體匹配/本體對齊),學習實例層融合技術(shù)(實體對齊/實體匹配)的實現(xiàn)方法。了解知識融合技術(shù)的前沿發(fā)展,包括基于表示學習的實體對齊方法。
(7)知識圖譜存儲與查詢:掌握基于關(guān)系型數(shù)據(jù)庫的知識圖譜存儲方案(RDF三元組表、屬性表)。學習基于原生圖數(shù)據(jù)庫(Neo4j、JanusGraph)的存儲實現(xiàn),理解原生圖數(shù)據(jù)庫的實現(xiàn)原理。掌握Cypher查詢語言的使用方法,實現(xiàn)圖譜數(shù)據(jù)的靈活檢索。了解JanusGraph與Neo4j的對比及適用場景選擇。
(8)知識圖譜建模與可視化實戰(zhàn):使用圖數(shù)據(jù)庫完成知識建模表示,學習數(shù)據(jù)批量導入方法(D2R工具、Python操作Neo4j)。掌握知識圖譜的可視化分析方法,實現(xiàn)圖譜數(shù)據(jù)的直觀展示和探索。
(9)知識圖譜推理與計算:理解推理的基本概念和知識圖譜推理的分類。掌握基于本體(Ontology)的推理和基于規(guī)則的推理。學習基于嵌入學習的知識圖譜推理和基于規(guī)則學習的知識圖譜推理。了解本體嵌入(Ontology Embedding)在概念層推理中的應用。掌握知識圖譜的計算能力,包括圖算法(PageRank、社區(qū)發(fā)現(xiàn))的實現(xiàn)。
(10)知識圖譜問答系統(tǒng):了解智能問答系統(tǒng)的分類和知識圖譜問答的應用場景。掌握基于查詢模板的知識圖譜問答、基于語義解析的問答方法、基于檢索排序的問答方法和基于深度學習的知識圖譜問答。實戰(zhàn)完成基于知識圖譜的醫(yī)藥問答系統(tǒng)或企業(yè)知識問答系統(tǒng)。
(11)知識圖譜與大模型融合(RAG與GraphRAG):理解大模型與知識圖譜結(jié)合的三大方向(知識圖譜增強大模型、大模型增強知識圖譜、知識增強的語言預訓練)。掌握檢索增強生成(RAG)的原理與優(yōu)化方法,包括向量表征、混合搜索和RAG優(yōu)化策略。學習GraphRAG的設計框架,掌握微軟GraphRAG工具的應用。實踐知識圖譜與向量檢索的混合搜索技術(shù)。
(12)綜合項目實戰(zhàn):行業(yè)知識圖譜系統(tǒng)開發(fā):結(jié)合所學知識,完成一個完整的行業(yè)知識圖譜項目(如金融風控知識圖譜、醫(yī)藥疾病知識圖譜、企業(yè)信息知識圖譜等)。涵蓋需求分析、本體設計、知識抽取、圖數(shù)據(jù)庫存儲、查詢接口開發(fā)和與大模型融合應用的全流程,形成規(guī)范的知識圖譜項目報告。