背景技術:
1、問題-答案對搜索涉及用戶以自然語言查詢的形式向嵌入模型提交問題。文檔語料庫中的每一段內容都使用相同的嵌入模型被索引到數據庫中。然后,系統檢取并產生一個或多個問題-答案對,其中,答案是對所提交問題的潛在答案。在第二步驟中,使用另一個模型對答案進行重新排序,該模型將問題-答案對作為輸入并且返回分數作為輸出。評分后的答案在結果列表或其他圖形界面中呈現給用戶。然而,一些答案可能具有很長的文本跨度,用戶可能難以快速看到并理解文本中的重要部分,同時也難以對模型產生可靠答案具有信心。
技術實現思路
1、為了解決上述問題,本公開的實施例在所得到的答案中突出顯示重要單詞,以便用戶既可以信任底層模型,又可以快速理解所給出答案中的重要單詞和短語。
2、在一個實施例中,一種響應于自然語言搜索查詢而顯示問題-答案對的答案的方法,方法包括:從圖形用戶界面接收自然語言查詢;從自然語言查詢生成多個問題-答案對;以及將多個問題-答案對輸入到基于transformer的雙向編碼器表示(bert)模型中。bert模型可以為多個問題-答案對中的每個問題-答案對生成注意力矩陣陣列,其中,注意力矩陣陣列中的每個注意力矩陣產生歸因(attribution)值陣列。方法進一步包括:將bert模型的輸出輸入到分類器中,其中,分類器將每個問題-答案對分類為滿意答案或不滿意答案;以及顯示每個滿意答案。每個滿意答案的一個或多個單詞至少部分地基于歸因值陣列被突出顯示。
3、在另一實施例中,一種響應于自然語言搜索查詢而顯示問題-答案對的答案的系統包括:一個或多個處理器;電子顯示器;以及非瞬態計算機可讀介質,非瞬態計算機可讀介質存儲指令,指令在由一個或多個處理器執行時,使一個或多個處理器進行以下操作:從圖形用戶界面接收自然語言查詢;從自然語言查詢生成多個問題-答案對;將多個問題-答案對輸入到基于transformer的雙向編碼器表示(bert)模型中。bert模型可以為多個問題-答案對中的每個問題-答案對生成注意力矩陣陣列,其中,注意力矩陣陣列中的每個注意力矩陣產生歸因值陣列。指令進一步使得一個或多個處理器進行以下操作:將bert模型的輸出輸入到分類器中,其中,分類器將每個問題-答案對分類為滿意答案或不滿意答案;以及顯示每個滿意答案,其中,滿意答案的一個或多個單詞至少部分地基于歸因值陣列被突出顯示。
4、在實施例中,一種響應于自然語言搜索查詢而顯示問題-答案對的答案的方法包括:從基于transformer的雙向編碼器表示(bert)模型接收問題-答案對的注意力矩陣陣列,其中,注意力矩陣陣列中的每個注意力矩陣包括歸因值陣列;根據注意力矩陣陣列,為問題-答案對的答案的每個單詞生成總歸因值;以及在電子顯示器上顯示答案,其中,答案的一個或多個單詞基于每個單詞的總歸因值被突出顯示。
1.一種響應于自然語言搜索查詢而顯示問題-答案對的答案的方法,所述方法包括:
2.如權利要求1所述的方法,所述方法進一步包括:針對每個滿意答案,根據與所述滿意答案相關聯的單個注意力矩陣陣列,為所述滿意答案的每個單詞生成總歸因值,其中,具有高于閾值的總歸因值的每個單詞被突出顯示。
3.如權利要求2所述的方法,所述滿意答案的每個單詞的歸因值是通過以下方式生成的:
4.如權利要求3所述的方法,其特征在于,所述注意力矩陣子集是通過損失函數和優化算法來選擇的。
5.如權利要求4所述的方法,其特征在于,所述注意力矩陣陣列包括多個頭部和多個層,所述多個頭部和所述多個層作為輸入提供給所述優化算法。
6.如權利要求1所述的方法,所述方法進一步包括應用后處理過程,所述后處理過程進行以下一項或多項操作:將突出顯示添加到具有突出顯示的單詞兩側相鄰的一個或多個單詞;以及,當突出顯示的短語的數量超過所述突出顯示的短語的最大數量時,從具有最低總歸因的一個或多個單詞中移除突出顯示。
7.如權利要求1所述的方法,其特征在于,所述分類器是所述bert模型的層。
8.一種響應于自然語言搜索查詢而顯示問題-答案對的答案的系統,所述系統包括:
9.如權利要求8所述的系統,所述指令使得所述一個或多個處理器進一步進行以下操作:從與所述滿意答案相關聯的單個注意力矩陣陣列中,為所述滿意答案的每個單詞生成總歸因值,其中,具有高于閾值的總歸因值的每個單詞被突出顯示。
10.如權利要求9所述的系統,所述滿意答案的每個單詞的歸因值是通過以下方式生成的:
11.如權利要求10所述的系統,其特征在于,所述注意力矩陣子集是通過損失函數和優化算法來選擇的。
12.如權利要求11所述的系統,其特征在于,所述注意力矩陣陣列包括多個頭部和多個層,所述多個頭部和所述多個層作為輸入提供給所述優化算法。
13.如權利要求8所述的系統,進一步包括應用后處理過程,所述后處理過程進行以下一項或多項操作:將突出顯示添加到具有小于第一閾值的總歸因值的一個或多個單詞;以及,從具有大于第二閾值的總歸因值的一個或多個單詞中移除突出顯示。
14.如權利要求8所述的系統,其特征在于,所述分類器是所述bert模型的層。
15.一種響應于自然語言搜索查詢而顯示問題-答案對的答案的方法,所述方法包括:
16.如權利要求15所述的方法,其特征在于,具有高于閾值的總歸因值的每個單詞被突出顯示。
17.如權利要求16所述的方法,滿意答案的每個單詞的歸因值是通過以下方式生成的:
18.如權利要求17所述的方法,其特征在于,所述注意力矩陣子集是通過損失函數和優化算法來選擇的。
19.如權利要求18所述的方法,其特征在于,所述注意力矩陣陣列包括多個頭部和多個層,所述多個頭部和所述多個層作為輸入提供給所述優化算法。
20.如權利要求15所述的方法,所述方法進一步包括應用后處理過程,所述后處理過程進行以下一項或多項操作:將突出顯示添加到具有突出顯示的單詞兩側相鄰的一個或多個單詞;以及,當突出顯示的短語的數量超過所述突出顯示的短語的最大數量時,從具有最低總歸因的一個或多個單詞中移除突出顯示。