本發明涉及神經科學,尤其是涉及一種ad和mci知識發現方法、裝置、電子設備及介質。
背景技術:
1、當前,隨著老齡化程度的逐步加深,阿爾茨海默病(ad)及輕度認知障礙(mildcognitive?impairment,mci)等慢性疾病給患者、家庭和社會帶來了沉重負擔;但同時,對于阿爾茨海默病及輕度認知障礙的風險因素、發生機制、干預方法的了解還存在不足。
2、為了更好的應對阿爾茨海默病等,一方面需要開展更多的醫學研究以研究相關的重要因素;另一方面,考慮到研究的成果主要通過學術文獻發布,如何高效的發現相關文獻、知識就是一個問題;尤其是,隨著近年來學術文獻的高速增長,考慮到ad/mci領域相關研究人員的時間緊張問題,如何高效率的發現相關文獻、如何高效率的獲取相關的領域進展知識等就變成了一個極為重要的問題。
3、對此,目前領域相關研究人員獲取文獻、獲取領域進展知識最重要的手段主要是靠人工獲取、人工閱讀文獻等,這直接帶來了耗費時間、效率低、質量低等問題;當前雖然有一些輔助性工具,但在方便性、準確性和效率等方面還存在很大不足。因此,在知識爆炸的背景下,獲取發現ad/mci相關的文獻、證據、知識、思路等的低效率、低質量等成為了一個急需解決的問題。
技術實現思路
1、有鑒于此,本發明的目的在于提供一種ad和mci知識發現方法、裝置、電子設備及介質,以提高獲取發現ad/mci相關知識的效率以及質量,降低工作量和復雜性,提高知識發現的效果。
2、為了實現上述目的,本發明采用的技術方案如下:
3、第一方面,本發明提供了一種ad和mci知識發現方法,包括:獲取ad/mci領域的文獻,并基于文獻構建ad/mci知識庫;其中,ad/mci知識庫包括:ad/mci文獻庫、ad/mci文獻實體庫、ad/mci證據庫、ad/mci索引庫;獲取用戶輸入的問題,并對問題進行預判斷確定回答問題的方式;基于回答問題的方式進行ad/mci知識庫檢索和/或ad/mci大語言模型交互,得到問題回答結果;其中,問題回答結果包括以下中的一種:第一最終檢索結果、第一交互結果、第二最終檢索結果和基于第二最終檢索結果的第二交互結果;如果得到第一最終檢索結果或第一交互結果,則將第一最終檢索結果或第一交互結果反饋至用戶,如果得到第二交互結果,則對第二交互結果進行相關性評價打分和一致性評價打分,如果第二交互結果的得分符合預設條件,則將第二交互結果反饋至用戶。
4、可選的,基于文獻構建ad/mci知識庫,包括:按照預先構建的ad/mci文獻庫的知識體系的標簽,提取每篇文獻的元數據,并基于預先構建的知識規則、分類模型和信息抽取模型對元數據進行處理,得到知識體系中每個標簽對應的內容,根據每篇文獻的每個標簽對應的內容和元數據構建ad/mci文獻庫;其中,元數據還包括文獻結構、內容;對于ad/mci文獻庫中的每篇文獻,基于預先構建的實體信息抽取模型抽取每篇文獻中的實體,構建ad/mci文獻實體庫;對于ad/mci文獻庫中的每篇文獻,如果文獻的文獻類型標簽內容中包括rct,則基于預先構建的證據抽取模型抽取每篇文獻中的證據信息,構建ad/mci證據庫;其中,證據信息為與rct有關的信息;分別構建ad/mci文獻庫、ad/mci文獻實體庫和ad/mci證據庫的子索引,并基于ad/mci文獻庫、ad/mci文獻實體庫和ad/mci證據庫的數據之間的關聯id將ad/mci文獻庫、ad/mci文獻實體庫和ad/mci證據庫進行整合和關聯后構建整體索引,得到ad/mci索引庫;其中,子索引和整體索引包括倒排索引和向量索引。
5、可選的,對問題進行預判斷確定回答問題的方式,包括:對問題進行客觀性判斷、ad/mci領域判斷和可回答性判斷;如果問題為客觀性問題、ad/mci領域的問題、可回答的問題,則基于預先構建的問題回答方式判斷模型確定回答問題的方式;其中,回答問題的方式包括:ad/mci知識庫檢索的方式、ad/mci大語言模型交互回答的方式、ad/mci知識庫檢索和ad/mci大語言模型交互回答結合的方式。
6、可選的,基于回答問題的方式進行ad/mci知識庫檢索和/或ad/mci大語言模型交互,得到問題回答結果,包括:如果回答問題的方式為ad/mci知識庫檢索的方式,則基于問題進行ad/mci知識庫檢索,得到第一最終檢索結果;如果回答問題的方式為ad/mci大語言模型交互回答的方式,則將問題輸入到ad/mci大語言模型中,得到第一交互結果;如果回答問題的方式為ad/mci知識庫檢索和ad/mci大語言模型交互回答結合的方式,則對問題進行預處理,并基于預處理后的問題進行ad/mci知識庫檢索,得到第二最終檢索結果,并基于第二最終檢索結果構建ad/mci大語言模型的提示,將提示輸入到ad/mci大語言模型中,得到基于第二最終檢索結果的第二交互結果。
7、可選的,對問題進行預處理,并基于預處理后的問題進行ad/mci知識庫檢索,得到第二最終檢索結果,包括:將問題輸入到ad/mci大語言模型中進行問題分解,并將分解結果與問題進行拼接,得到拼接查詢問題;對拼接查詢問題進行分詞和關鍵詞提取得到第一關鍵詞列表,并將第一關鍵詞列表輸入到預先構建的同義詞大語言模型中得到關鍵詞的第一同義詞列表;基于預先構建的信息抽取模型抽取問題的實體,得到第一實體列表;基于預先構建的判斷模型對問題進行檢索條件判斷,得到判斷條件結果;其中,檢索條件至少包括:目標內容所屬的文獻類型、目標內容在文獻中的所處位置;基于關鍵詞的第一同義詞列表和判斷條件結果確定針對ad/mci文獻庫的倒排索引的第一檢索邏輯,以及基于拼接查詢問題和判斷條件結果確定針對ad/mci文獻庫的向量索引的第二檢索邏輯,并基于第一檢索邏輯進行倒排索引檢索得到第一文獻檢索結果,基于第二檢索邏輯進行向量檢索得到第二文獻檢索結果;基于第一實體列表和判斷條件結果確定針對ad/mci文獻實體庫的第三檢索邏輯,并基于第三檢索邏輯進行ad/mci文獻實體庫檢索,得到第一實體檢索結果;如果判斷條件結果中的文獻類型中包括rct,則基于第一實體列表和關鍵詞的第一同義詞列表確定針對ad/mci證據庫的第四檢索邏輯,并基于第四檢索邏輯進行ad/mci證據庫檢索,得到第一證據檢索結果;將問題、第一文獻檢索結果、第二文獻檢索結果、第一實體檢索結果和第一證據檢索結果輸入到預先構建的第一評價打分模型中得到每個檢索結果的打分結果,并基于打分結果確定第二最終檢索結果。
8、可選的,基于問題進行ad/mci知識庫檢索,得到第一最終檢索結果,包括:對問題進行分詞和關鍵詞提取得到第二關鍵詞列表,并將第二關鍵詞列表輸入到預先構建的同義詞大語言模型中得到關鍵詞的第二同義詞列表;基于預先構建的信息抽取模型抽取問題的實體,得到第二實體列表;基于關鍵詞的第二同義詞列表和第二實體列表構建針對ad/mci文獻庫的第五檢索邏輯、針對ad/mci文獻實體庫的第六檢索邏輯,以及針對ad/mci證據庫的第七檢索邏輯;基于第五檢索邏輯進行ad/mci文獻庫檢索得到第三文獻檢索結果,基于第六檢索邏輯進行ad/mci文獻實體庫檢索得到第二實體檢索結果,以及基于第七檢索邏輯進行ad/mci證據庫檢索得到第二證據檢索結果;將問題、第三文獻檢索結果、第二實體檢索結果和第二證據檢索結果輸入到預先構建的第一評價打分模型中得到每個檢索結果的打分結果,并基于打分結果確定第一最終檢索結果。
9、可選的,基于第二最終檢索結果構建ad/mci大語言模型的提示,包括:確定ad/mci大語言模型的角色、任務和要求;對第二最終檢索結果進行預處理后,基于第二最終檢索結果的打分結果對所述預處理后的第二最終檢索結果進行排序得到參考資料;其中,對第二最終檢索結果預處理包括:對第二最終檢索結果中的文獻內容進行總結和壓縮、對第二最終檢索結果中長度超過預設長度的內容進行壓縮,以及將第二最終檢索結果中的證據內容組合成自然語言句子;基于第一關鍵詞列表和第一實體列表確定線索信息;基于問題、ad/mci大語言模型的角色、任務、要求、參考資料和線索信息構建ad/mci大語言模型的提示。
10、可選的,對第二交互結果進行相關性評價打分和一致性評價打分,如果第二交互結果的得分符合預設條件,則將第二交互結果反饋至用戶,包括:基于預先設定的規則對第二交互結果進行過濾;將過濾后的第二交互結果輸入到預先構建的第二評價打分模型中得到第二交互結果的評價打分;如果第二交互結果的評價打分大于或等于第一閾值,則將第二交互結果反饋至用戶;如果第二交互結果的評價打分大于或等于第二閾值且小于第一閾值,則對第二交互結果進行一致性評價打分;其中,第一閾值大于第二閾值;如果第二交互結果的評價打分小于第二閾值,則重新構建ad/mci大語言模型的提示,得到新的第二交互結果,并對新的第二交互結果進行相關性評價打分,如果新的第二交互結果的評價打分小于第二閾值,則重新對問題進行預處理,并對預處理后的問題進行ad/mci知識庫檢索和ad/mci大語言模型交互得到新的第二交互結果。
11、可選的,對第二交互結果進行一致性評價打分,包括:基于第二交互結果構建要點總結提示,并將要點總結提示輸入到ad/mci大語言模型中得到第二交互結果的要點總結結果;基于預先構建的第三評價打分模型對要點總結結果進行打分,得到要點總結結果的評價打分;如果要點總結結果的評價打分大于或等于第三閾值,則將第二交互結果反饋至用戶;如果要點總結結果的評價打分小于第三閾值,則重新構建ad/mci大語言模型的提示,得到新的第二交互結果,并對新的第二交互結果進行要點總結以及對新的第二交互結果的要點總結結果進行打分,如果新的第二交互結果的要點總結結果的評價打分小于第三閾值,則重新對問題進行預處理,并對預處理后的問題進行ad/mci知識庫檢索和ad/mci大語言模型交互得到新的第二交互結果。
12、第二方面,本發明提供了一種ad和mci知識發現裝置,包括:知識庫構建模塊,用于獲取ad/mci領域的文獻,并基于文獻構建ad/mci知識庫;其中,ad/mci知識庫包括:ad/mci文獻庫、ad/mci文獻實體庫、ad/mci證據庫、ad/mci索引庫;預判斷模塊,用于獲取用戶輸入的問題,并對問題進行預判斷確定回答問題的方式;檢索和交互模塊,用于基于回答問題的方式進行ad/mci知識庫檢索和/或ad/mci大語言模型交互,得到問題回答結果;其中,問題回答結果包括以下中的一種:第一最終檢索結果、第一交互結果、第二最終檢索結果和基于第二最終檢索結果的第二交互結果;結果評價和反饋模塊,用于如果得到第一最終檢索結果或第一交互結果,則將第一最終檢索結果或第一交互結果反饋至用戶,如果得到第二交互結果,則對第二交互結果進行相關性評價打分和一致性評價打分,如果第二交互結果的得分符合預設條件,則將第二交互結果反饋至用戶。
13、第三方面,本發明提供了一種電子設備,包括處理器和存儲器,存儲器存儲有能夠被處理器執行的計算機可執行指令,處理器執行計算機可執行指令以實現上述第一方面提供的任一項的方法的步驟。
14、第四方面,本發明提供了一種計算機可讀存儲介質,計算機可讀存儲介質上存儲有計算機程序,計算機程序被處理器運行時執行上述第一方面提供的任一項的方法的步驟。
15、本發明帶來了以下有益效果:
16、本發明提供的上述ad和mci知識發現方法、裝置、電子設備及介質,首先獲取ad/mci領域的文獻,并基于文獻構建ad/mci知識庫(ad/mci文獻庫、ad/mci文獻實體庫、ad/mci證據庫、ad/mci索引庫);然后獲取用戶輸入的問題,并對問題進行預判斷確定回答問題的方式;之后基于回答問題的方式進行ad/mci知識庫檢索和/或ad/mci大語言模型交互,得到問題回答結果(問題回答結果包括以下中的一種:第一最終檢索結果、第一交互結果、第二最終檢索結果及基于第二最終檢索結果的第二交互結果);最后如果得到第一最終檢索結果或第一交互結果,則將第一最終檢索結果或第一交互結果反饋至用戶,如果得到第二交互結果,則對第二交互結果進行相關性評價打分和一致性評價打分,如果第二交互結果的得分符合預設條件,則將第二交互結果反饋至用戶。上述方法通過構建實時更新的、多維的包括文獻、實體、證據、索引等在內的ad/mci知識庫,保證了ad/mci知識的全面和最新;通過對用戶的問題進行預判斷,對問題復雜程度和回答方式進行匹配,在保證知識發現效率的基礎上,也保證了準確性和效果;通過對用戶問題的檢索結果、ad/mci大語言模型的交互結果進行相關性評價打分和一致性評價打分,保證了回復結果的準確,從而提高了獲取發現ad/mci相關知識的效率以及質量,降低了工作量和復雜性。
17、本發明的其他特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發明而了解。本發明的目的和其他優點在說明書、權利要求書以及附圖中所特別指出的結構來實現和獲得。
18、為使本發明的上述目的、特征和優點能更明顯易懂,下文特舉較佳,并配合所附附圖,作詳細說明如下。