您當前的位置:首頁 > 文化

知識圖譜

作者:由 liukai12138 發表于 文化時間:2018-01-11

知識圖譜的三個核心邏輯

1。找到正確的東西

2。展示更加恰當的摘要

3。更深更廣

知識圖譜構建的過程:一是知識獲取,從非結構化、半結構化以及結構化資料中獲取知識;二是資料融合,將不同資料來源獲取知識進行融合構建資料之間的關聯;三是知識計算及應用

知識計算主要是根據圖譜提供的資訊得到更多的隱含知識,如透過本體或者規則推理技術獲取資料中存在的隱含知識;而連線預測則可預測實體間隱含關係;同時使用社會計算的不同演算法在知識網路上計算獲取知識圖譜上存在的社群,提供知識間關聯的路徑;透過不一致檢測技術發現數據中的噪聲和缺陷。

透過知識計算知識圖譜可以產生大量的智慧應用,如可以提供精確的使用者畫像為精準營銷系統提供潛在的客戶;提供領域知識給專家系統提供決策資料,提供更智慧的搜尋方式,使使用者可以透過自然語言進行搜尋。

知識圖譜

知識融合與資料融合

知識融合是將多個數據源抽取的知識進行融合

知識融合可能使用多個知識抽取工具為每個資料項從每個資料來源中抽取相應的值,而資料融合未考慮多個抽取工具。因此,知識融合除了應對抽取出來的事實本身可能存在的噪聲外,還比資料融合多引入了一個噪聲,就是不同抽取工具透過實體連結和本體匹配可能產生不同的結果。另外,知識融合還需要考慮本體的融合和例項的融合。

從知識獲取以後,知識往往是分散、異構、自治存在的,另外還有冗餘、噪音、不確定、非完備的特點,通常需要融合和驗證的步驟,將不同源不同結構的資料融合成統一的知識圖譜,以保證知識的一致性。因此知識的融合主要工作是對獲取的知識(三元組)進行融合,去冗餘,去衝突,規範化。,包括實體對齊,屬性對齊,衝突消解,規範化等

知識驗證

再往上一層主要是

驗證

,分為

補全、糾錯、外鏈、更新

各部分,確保知識圖譜的

一致性和準確性

。一個典型問題是,知識圖譜的構建不是一個靜態的過程,當引入新知識時,需要判斷新知識是否正確,與已有知識是否一致,如果新知識與舊知識間有衝突,那麼要判斷是原有的知識錯了,還是新的知識不靠譜?這裡可以用到的證據可以是

權威度、冗餘度、多樣性、一致性

等。如果新知識是正確的,那麼要進行相關實體和關係的更新。

標簽: 知識  融合  圖譜  抽取  資料