麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種知識圖譜實體對齊方法、系統、設備、介質及產品

文檔序號:41737706發布日期:2025-04-25 17:11閱讀:4來源:國知局
一種知識圖譜實體對齊方法、系統、設備、介質及產品

本發明屬于開放知識圖譜,具體涉及一種知識圖譜實體對齊方法、系統、設備、介質及產品。


背景技術:

1、本部分的陳述僅僅是提供了與本發明相關的背景技術信息,不必然構成在先技術。

2、知識圖譜通過圖結構將實體、屬性和關系組織起來,提供了一種高效的知識表示方式,在信息檢索、智能問答、推薦系統等領域發揮著重要作用。隨著知識圖譜的深入應用,單一知識圖譜通常難以提供足夠的知識來支持下游任務,無法滿足復雜應用場景的知識需求。因此,為了提升知識的覆蓋率,需要對不同知識圖譜中的信息進行整合。然而,由于知識圖譜的來源多樣、構建標準不統一,在表示同一實體時往往存在語義和結構上的差異。例如,dbpedia知識圖譜中的實體“mount_everest”與wikidata中的實體“q513”雖然指向同一地理對象,卻采用了完全不同的命名方式。通過實體對齊技術可以自動地識別這些有著不同表述的等效實體,從而推動知識圖譜在各個領域的廣泛應用。

3、實體對齊技術將不同知識圖譜中的實體映射到統一向量空間,通過實體間的相似性來判斷其對應關系,從而獲得準確的對齊結果。現有方法雖然已經取得了較好的效果,但是卻沒有充分捕獲屬性三元組中的語義信息,同時也沒有考慮實體間關系的相似性對于識別等效實體的重要作用,從而影響了實體對齊的準確性。


技術實現思路

1、為了解決上述問題,本發明提出了一種知識圖譜實體對齊方法、系統、設備、介質及產品,本發明利用屬性值的嵌入向量來獲取屬性的嵌入表示,從而能夠更準確地捕捉屬性的語義特征,再利用圖注意力機制獲得屬性感知嵌入。同時,該模型考慮了實體間關系相似性的重要作用,提出了一種新穎的邊卷積模塊,以鄰域聚合的方式實現了對關系的有效表示。最后,該模型引入了門控機制進行特征融合,自適應地平衡屬性感知嵌入和關系感知嵌入二者的貢獻,生成更具表達力的實體嵌入表示。

2、根據一些實施例,本發明的第一方案提供了一種知識圖譜實體對齊方法,采用如下技術方案:

3、一種知識圖譜實體對齊方法,包括:

4、任意獲取兩個知識圖譜進行預處理,確定實體的屬性三元組和關系三元組;

5、利用預先訓練好的知識圖譜實體對齊模型進行實體對齊,具體為:

6、基于實體的屬性三元組獲取實體的屬性值進行編碼得到屬性值嵌入向量,對屬性值嵌入向量進行特征提取得到屬性嵌入向量,根據每個屬性值嵌入向量和屬性嵌入向量拼接后的權重聚合所有的拼接結果,獲得實體的屬性感知嵌入;

7、基于實體的關系三元組分別對實體間的關系和實體的鄰居節點信息進行編碼,得到關系信息編碼和鄰域信息編碼,根據每個關系信息編碼和鄰域信息編碼拼接后的權重聚合實體所有的鄰居節點,獲得實體的關系感知嵌入;

8、利用可學習的融合門控機制對屬性感知嵌入和關系感知嵌入進行融合,生成信息增強實體嵌入;

9、根據兩個知識圖譜中信息增強實體嵌入之間的相似度實現知識圖譜的實體對齊。

10、進一步地,所述根據每個屬性值嵌入向量和屬性嵌入向量拼接后的權重聚合所有的拼接結果,獲得實體的屬性感知嵌入,具體為:

11、拼接屬性值嵌入向量和屬性嵌入向量得到實體的屬性三元組表示向量;

12、以實體所有的屬性三元組表示向量的均值作為實體的初始屬性嵌入;

13、利用圖注意力機制計算實體的初始屬性嵌入與其屬性三元組表示向量之間的權重;

14、利用每個屬性三元組表示向量對應的權重聚合所有的屬性三元組表示向量,并根據聚合結果和實體的初始屬性嵌入進行正則化,得到實體的屬性感知嵌入。

15、進一步地,所述基于實體的關系三元組分別對實體間的關系和實體的鄰居節點信息進行編碼,得到關系信息編碼和鄰域信息編碼,具體為:

16、基于實體的關系三元組,利用多層圖卷積網絡對實體的鄰居節點信息進行編碼,得到鄰域信息編碼;

17、基于實體的關系三元組,對知識圖譜中的邊進行初始化,即對實體的鄰接關系進行初始化,得到關系邊向量;

18、基于實體的鄰接關系所對應的聚合權重對所有的關系邊向量進行聚合,得到關系信息編碼。

19、進一步地,利用可學習的融合門控機制對屬性感知嵌入和關系感知嵌入進行融合,生成信息增強實體嵌入,具體為:

20、基于屬性感知嵌入和關系感知嵌入以及對應的可學習權重矩陣,確定比例門信號;

21、根據比例門信號確定屬性感知嵌入和關系感知嵌入的組合比例,基于組合比例對屬性感知嵌入和關系感知嵌入進行融合,得到信息增強實體嵌入。

22、進一步地,所述根據兩個知識圖譜中信息增強實體嵌入之間的相似度實現知識圖譜的實體對齊,具體為:

23、計算兩個知識圖譜中實體的信息增強實體嵌入之間的曼哈頓距離作為實體間的相似度,構建相似度矩陣;

24、對相似度矩陣的行和列轉化為概率分布,生成細化相似度矩陣;

25、通過對細化相似度矩陣每一行中存儲的距離值排序,以距離值最小尋找匹配的實體對。

26、進一步地,基于實體對齊結果對知識圖譜實體對齊模型進行訓練,具體為:

27、基于實體對齊結果確定兩個知識圖譜中的負樣本,計算負樣本中實體對間的曼哈頓距離;

28、以最小化對齊實體間的曼哈頓距離和最大化負樣本實體對間的曼哈頓距離,構建鉸鏈損失函數;

29、利用鉸鏈損失函數對知識圖譜實體對齊模型進行訓練以優化模型參數;

30、直到鉸鏈損失最小,得到訓練好的知識圖譜實體對齊模型。

31、根據一些實施例,本發明的第二方案提供了一種知識圖譜實體對齊系統,采用如下技術方案:

32、一種知識圖譜實體對齊系統,包括:

33、數據預處理模塊,被配置為任意獲取兩個知識圖譜進行預處理,確定實體的屬性三元組和關系三元組;

34、知識圖譜實體對齊模塊,被配置為利用預先訓練好的知識圖譜實體對齊模型進行實體對齊,具體為:

35、基于實體的屬性三元組獲取實體的屬性值進行編碼得到屬性值嵌入向量,對屬性值嵌入向量進行特征提取得到屬性嵌入向量,根據每個屬性值嵌入向量和屬性嵌入向量拼接后的權重聚合所有的拼接結果,獲得實體的屬性感知嵌入;

36、基于實體的關系三元組分別對實體間的關系和實體的鄰居節點信息進行編碼,得到關系信息編碼和鄰域信息編碼,根據每個關系信息編碼和鄰域信息編碼拼接后的權重聚合實體所有的鄰居節點,獲得實體的關系感知嵌入;

37、利用可學習的融合門控機制對屬性感知嵌入和關系感知嵌入進行融合,生成信息增強實體嵌入;

38、根據兩個知識圖譜中信息增強實體嵌入之間的相似度實現知識圖譜的實體對齊。

39、根據一些實施例,本發明的第三方案提供了一種計算機可讀存儲介質。

40、一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如上述第一個方面所述的一種知識圖譜實體對齊方法中的步驟。

41、根據一些實施例,本發明的第四方案提供了一種計算機設備。

42、一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述第一個方面所述的一種知識圖譜實體對齊方法中的步驟。

43、根據一些實施例,本發明的第五個方面提供一種計算機程序產品或計算機程序。

44、本發明提供了一種計算機程序產品或計算機程序,該計算機程序產品或計算機程序包括計算機指令,該計算機指令存儲在計算機可讀存儲介質中。計算機設備的處理器從計算機可讀存儲介質讀取該計算機指令,處理器執行該計算機指令,使得該計算機設備執行如上述第一個方面所述的一種知識圖譜實體對齊方法中的步驟。

45、與現有技術相比,本發明的有益效果為:

46、本發明以實體的屬性三元組數據為基礎,利用預訓練模型獲取屬性值的嵌入表示,并通過屬性值對其對應的屬性進行編碼。與直接對屬性進行嵌入相比,這種方法能夠更充分地利用屬性值的信息,從而更準確地捕捉屬性在知識圖譜中的語義特征。

47、本發明考慮到不同知識圖譜中的等效實體不僅在鄰域節點上是相似的,實體間的關系信息也應該是相似的。因此,該模型以鄰域聚合的方式實現了對關系的獨立編碼,增強了模型對實體關系的表征能力。

48、本發明引入了門控機制將屬性感知嵌入與關系感知嵌入進行有效融合。與簡單的向量拼接相比,這種自適應融合能夠動態調整屬性信息和關系信息的權重,避免信息冗余和沖突,從而提升實體嵌入的表達能力和泛化性能。

49、本發明將得到的相似度矩陣通過softmax操作,生成了一個細化的相似度矩陣。這可以使矩陣中的每個值都體現了從兩個方向評估的實體對的匹配程度,得到全面的相似度表征,從而更好地支持對齊算法。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 阿图什市| 六枝特区| 方正县| 营口市| 正镶白旗| 英吉沙县| 高密市| 二连浩特市| 原阳县| 农安县| 商洛市| 栖霞市| 高淳县| 浦城县| 深泽县| 溧阳市| 钟山县| 孙吴县| 晋宁县| 松桃| 咸丰县| 孝义市| 镇宁| 木兰县| 临桂县| 司法| 淮阳县| 榆中县| 安泽县| 临清市| 盐边县| 赤城县| 清水河县| 巴塘县| 东乌| 海城市| 上犹县| 凤冈县| 类乌齐县| 安仁县| 巫山县|