1.一種標點添加方法,其特征在于,包括:
獲取包含標點的預設訓練語料信息;
利用所述預設訓練語料信息和預設的網絡模型結構進行訓練,得到標點添加模型,其中,所述預設的網絡模型結構包括編碼器結構和解碼器結構;
接收用戶輸入的語音數據信息;
對所述語音數據信息進行識別,得到所述語音數據信息對應的文本信息和停頓信息;
根據所述文本信息、所述停頓信息和所述標點添加模型,確定所述文本信息對應的標點信息。
2.根據權利要求1所述的方法,其特征在于,所述編碼器結構包括第一LSTM隱藏層,所述解碼器結構包括第二LSTM隱藏層。
3.根據權利要求2所述的方法,其特征在于,所述利用所述預設訓練語料信息和預設的網絡模型結構進行訓練,得到標點添加模型,包括:
確定所述預設訓練語料信息對應的語料文本信息、語料停頓信息和語料標點信息;
將所述語料文本信息和所述語料停頓信息確定為所述預設的網絡模型結構的輸入向量,將所述語料標點信息確定為所述預設的網絡模型結構的輸出向量,計算所述預設網絡模型結構對應的目標模型參數;
根據所述目標模型參數和所述預設的網絡模型結構確定所述標點添加模型。
4.根據權利要求3所述的方法,其特征在于,所述將所述語料文本信息和所述語料停頓信息確定為所述預設的網絡模型結構的輸入向量,將所述語料標點信息確定為所述預設的網絡模型結構的輸出向量,計算所述預設網絡模型結構對應的目標模型參數,包括:
利用所述語料文本信息、所述語料停頓信息、所述語料標點信息和所述預設的網絡模型結構進行前向計算,確定所述預設網絡模型結構對應的模型參數;
利用所述語料文本信息、所述語料停頓信息、所述語料標點信息和所述預設的網絡模型結構進行后向計算,對所述模型參數進行修正,得到所述目標模型參數。
5.根據權利要求1所述的方法,其特征在于,所述根據所述文本信息、所述停頓信息和所述標點添加模型,確定所述文本信息對應的標點信息,包括:
將所述文本信息和所述停頓信息作為所述標點添加模型的輸入向量,得到所述標點添加模型的輸出向量;
根據所述標點添加模型的輸出向量確定所述文本信息對應的標點信息。
6.一種標點添加裝置,其特征在于,包括:
獲取模塊,用于獲取包含標點的預設訓練語料信息;
訓練模塊,用于利用所述預設訓練語料信息和預設的網絡模型結構進行訓練,得到標點添加模型,其中,所述預設的網絡模型結構包括編碼器結構和解碼器結構;
接收模塊,用于接收用戶輸入的語音數據信息;
識別模塊,用于對所述語音數據信息進行識別,得到所述語音數據信息對應的文本信息和停頓信息;
確定模塊,用于根據所述文本信息、所述停頓信息和所述標點添加模型,確定所述文本信息對應的標點信息。
7.根據權利要求6所述的裝置,其特征在于,所述編碼器結構包括第一LSTM隱藏層,所述解碼器結構包括第二LSTM隱藏層。
8.根據權利要求7所述的裝置,其特征在于,所述訓練模塊包括:
第一確定子模塊,用于確定所述預設訓練語料信息對應的語料文本信息、語料停頓信息和語料標點信息;
計算子模塊,用于將所述語料文本信息和所述語料停頓信息確定為所述預設的網絡模型結構的輸入向量,將所述語料標點信息確定為所述預設的網絡模型結構的輸出向量,計算所述預設網絡模型結構對應的目標模型參數;
第二確定子模塊,用于根據所述目標模型參數和所述預設的網絡模型結構確定所述標點添加模型。
9.根據權利要求8所述的裝置,其特征在于,所述計算子模塊用于:
利用所述語料文本信息、所述語料停頓信息、所述語料標點信息和所述預設的網絡模型結構進行前向計算,確定所述預設網絡模型結構對應的模型參數;
利用所述語料文本信息、所述語料停頓信息、所述語料標點信息和所述預設的網絡模型結構進行后向計算,對所述模型參數進行修正,得到所述目標模型參數。
10.根據權利要求6所述的裝置,其特征在于,所述確定模塊包括:
處理子模塊,用于將所述文本信息和所述停頓信息作為所述標點添加模型的輸入向量,得到所述標點添加模型的輸出向量;
第三確定子模塊,用于根據所述標點添加模型的輸出向量確定所述文本信息對應的標點信息。