1.一種用于對話交互系統的數據處理方法,其特征在于,包括:
交互數據獲取步驟,獲取用戶輸入的對話交互數據;
對話模型結果生成步驟,對所述對話交互數據進行解析,將解析結果輸入到預設對話生成模型中,得到對話模型結果,其中,所述對話生成模型是基于NRM以及增強學習算法構建的;
反饋數據輸出步驟,根據所述對話模型結果生成相應的反饋數據并輸出。
2.如權利要求1所述的方法,其特征在于,所述預設對話生成模型包括編碼層和解碼層,其中,所述編碼層用于根據解析得到的分詞結果生成所述分詞結果的全部向量表達和部分向量表達,并對所述全部向量表達和部分向量表達進行拼接,得到拼接結果,所述解碼層用于基于注意力機制根據所述拼接結果生成所述對話模型結果。
3.如權利要求2所述的方法,其特征在于,所述解碼層基于增強學習算法的神經網絡進行對話模型結果的生成。
4.如權利要求3所述的方法,其特征在于,在所述增強學習算法中,將MMI函數作為獎勵函數。
5.如權利要求1~4中任一項所述的方法,其特征在于,所述方法還包括:
模型修正步驟,獲取所述用戶針對所述反饋數據的輸入數據,并根據所述輸入數據對所述預設對話生成模型進行修正。
6.一種用于對話交互系統的數據處理裝置,其特征在于,包括:
交互數據獲取模塊,其用于獲取用戶輸入的對話交互數據;
對話模型結果生成模塊,其用于對所述對話交互數據進行解析,將解析結果輸入到預設對話生成模型中,得到對話模型結果,其中,所述對話生成模型是基于NRM以及增強學習算法構建的;
反饋數據輸出模塊,其用于根據所述對話模型結果生成相應的反饋數據并輸出。
7.如權利要求6述的裝置,其特征在于,所述預設對話生成模型包括編碼層和解碼層,其中,所述編碼層配置為根據解析得到的分詞結果生成所述分詞結果的全部向量表達和部分向量表達,并對所述全部向量表達和部分向量表達進行拼接,得到拼接結果,所述解碼層配置為基于注意力機制根據所述拼接結果生成所述對話模型結果。
8.如權利要求7所述的裝置,其特征在于,所述解碼層配置為基于增強學習算法的神經網絡進行反饋數據的生成。
9.如權利要求8所述的裝置,其特征在于,在所述增強學習算法中,將MMI函數作為獎勵函數。
10.如權利要求6~9中任一項所述的裝置,其特征在于,所述裝置還包括:
模型修正模塊,其用于獲取所述用戶針對所述反饋數據的輸入數據,并根據所述輸入數據對所述預設對話生成模型進行修正。