本申請涉及數據處理,尤其涉及到一種信息抽取方法及相關設備。
背景技術:
1、在日常生活或工作中,使用文本的場景越來越多,從而對文本進行檢查越來越重要。例如,在正常商業交流和活動中,為保障相關方的利益和提供法律保障,相關方需要簽訂大量合同文本,為了保證合同文本的合法性和避免風險,合同簽訂方需要在合同正式簽訂之前進行審查/檢查。
2、目前常用的文本審查方法是文本智能檢查方法,在文本智能檢查中,要素抽取是關鍵。因此如何從文本中獲取到待抽取要素對應的內容成為本領域研究的熱點問題之一。
技術實現思路
1、本申請實施例提供一種信息抽取方法及相關設備,有利于提高要素抽取的準確性。
2、為了解決上述技術問題,本申請是這樣實現的:
3、第一方面,本申請實施例提供了一種信息抽取方法,包括:
4、基于待抽取要素對待抽取文本進行信息抽取,得到m個第一抽取結果,m為大于1的整數;
5、對所述m個第一抽取結果進行不一致性檢測,得到檢測結果;所述檢測結果用于反映所述m個第一抽取結果之間的不一致性;
6、根據所述檢測結果確定所述待抽取要素的第二抽取結果。
7、第二方面,本申請實施例還提供一種信息抽取裝置,包括:
8、抽取模塊,用于基于待抽取要素對待抽取文本進行信息抽取,得到m個第一抽取結果,m為大于1的整數;
9、確定模塊,用于對所述m個第一抽取結果進行不一致性檢測,得到檢測結果,所述檢測結果用于反映所述m個第一抽取結果之間的不一致性;
10、所述確定模塊,還用于根據所述檢測結果確定所述待抽取要素的第二抽取結果。
11、第三方面,本申請實施例還提供一種電子設備,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述信息抽取方法中的步驟。
12、第四方面,本申請實施例還提供一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現上述信息抽取方法中的步驟。
13、第五方面,本申請實施例還提供一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現上述信息抽取方法中的步驟。
14、可以看出,本實施例中,基于待抽取要素,對待抽取文本進行信息抽取,可得到待抽取要素的m個第一抽取結果,可對m個第一抽取結果進行統計以對這m個第一抽取結果的不一致性進行檢測,得到檢測結果,檢測結果反映了m個第一抽取結果的不一致性,或者說可表征m個第一抽取結果的不一致程度,也可以理解表征了m個第一抽取結果的差異性。對于同一待抽取要素,其m個第一抽取結果差異越小即不一致性越小,可表示針對這同一個待抽取要素的抽取效果越好,反之抽取效果越差,不一致參數一定程度上反映了m個第一抽取結果的抽取效果,因此,在本實施例的信息抽取方法中,在進行信息抽取得到待抽取要素的m個第一抽取結果之后,可對這m個第一抽取結果進行不一致性檢測,也即是檢測了m個第一抽取結果的抽取效果,得到m個第一抽取結果的檢測結果,進一步利用了多個第一抽取結果的檢測結果確定第二抽取結果。利用m個抽取結果之間的差異性,從中選取第二抽取結果,實現了對抽取結果的二次篩選,可提高要素的抽取結果的準確性。
1.一種信息抽取方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述m個第一抽取結果進行不一致性檢測,得到檢測結果,包括:
3.根據權利要求1所述的方法,其特征在于,所述基于待抽取要素對待抽取文本進行信息抽取,得到m個第一抽取結果,包括:
4.根據權利要求3所述的方法,其特征在于,所述基于所述待抽取要素和所述待抽取要素的提示信息,對所述待抽取文本進行信息抽取,得到所述待抽取要素的m個第一抽取結果,包括:
5.根據權利要求3所述的方法,其特征在于,所述根據所述檢測結果確定所述待抽取要素的第二抽取結果,包括:
6.根據權利要求5所述的方法,其特征在于,所述從所述待抽取要素的m個第一抽取結果中確定所述待抽取要素的第二抽取結果是通過數據處理模型執行的,所述數據處理模型通過以下方式訓練得到:
7.一種信息抽取裝置,其特征在于,包括:
8.一種電子設備,其特征在于,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如權利要求1至6中任一項所述的信息抽取方法中的步驟。
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至6中任一項所述的信息抽取方法中的步驟。
10.一種計算機程序產品,其特征在于,包括計算機程序,所述計算機程序在被處理器執行時實現根據權利要求1-6中任一項所述的方法。