1.一種基于深度學習的智慧視聽設備多業務控制方法,其特征在于,所述方法包括:
麥克風陣列以特定頻率監聽采集用戶發出的語音控制信號;
語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息;檢測MFCC原始語音特征的對數能量是否大于閾值;若是,則由互聯網連接模塊發送MFCC原始語音特征信息到遠程GPU服務器;
遠程GPU服務器接收到MFCC原始語音特征信息,根據MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發送給互聯網連接模塊;
互聯網連接模塊將控制信號標識信息傳遞給控制信號解析模塊,由控制信號解析模塊根據控制信號標識信息生成控制信號編碼,選擇對應的控制信號輸出模塊,將控制信號編碼傳遞給該控制信號輸出模塊;
控制信號輸出模塊根據控制信號編碼發送控制信號給智慧視聽設備。
2.如權利要求1所述的基于深度學習的智慧視聽設備多業務控制方法,其特征在于,所述語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息的步驟,包括:
對語音控制信號進行端點檢測及分割處理;
對分割處理后的語音控制信號進行降噪處理;
對降噪處理后的語音控制信號進行MFCC原始語音特征提取,獲得MFCC原始語音特征信息。
3.如權利要求1所述的基于深度學習的智慧視聽設備多業務控制方法,其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息的步驟,包括:
遠程GPU服務器接收到MFCC原始語音特征信息,啟動深度學習語音識別程序,采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息。
4.如權利要求1所述的基于深度學習的智慧視聽設備多業務控制方法,其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,根據MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發送給互聯網連接模塊的步驟,包括:
遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發送給互聯網連接模塊;
遠程GPU服務器對深度語音特征信息進行分類,得到該深度語音特征信息對應的類別,并檢測該類別是否對應一種控制信號標識;若是,返回控制信號標識信息給互聯網連接模塊。
5.一種基于深度學習的智慧視聽設備多業務控制系統,其特征在于,所述系統包括:麥克風陣列、語音預處理模塊、遠程GPU服務器、互聯網連接模塊、控制信號解析模塊、控制信號輸出模塊;其中,
麥克風陣列以特定頻率監聽采集用戶發出的語音控制信號;
語音預處理模塊對語音控制信號進行提取,獲得MFCC原始語音特征信息;檢測MFCC原始語音特征的對數能量是否大于閾值;若是,則由互聯網連接模塊發送MFCC原始語音特征信息到遠程GPU服務器;
遠程GPU服務器接收到MFCC原始語音特征信息,根據MFCC原始語音特征信息獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發送給互聯網連接模塊;
互聯網連接模塊將控制信號標識信息傳遞給控制信號解析模塊,由控制信號解析模塊根據控制信號標識信息生成控制信號編碼,選擇對應的控制信號輸出模塊,將控制信號編碼傳遞給該控制信號輸出模塊;
控制信號輸出模塊根據控制信號編碼發送控制信號給智慧視聽設備。
6.如權利要求5所述的基于深度學習的智慧視聽設備多業務控制系統,其特征在于,所述語音預處理模塊包括:
分割單元,用于對語音控制信號進行端點檢測及分割處理;
降噪單元,用于對分割處理后的語音控制信號進行降噪處理;
提取單元,用于對降噪處理后的語音控制信號進行MFCC原始語音特征提取,獲得MFCC原始語音特征信息。
7.如權利要求5所述的基于深度學習的智慧視聽設備多業務控制系統,其特征在于,所述遠程GPU服務器接收到MFCC原始語音特征信息,啟動深度學習語音識別程序,采用biLSTM算法對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息。
8.如權利要求5所述的基于深度學習的智慧視聽設備多業務控制系統,其特征在于,遠程GPU服務器接收到MFCC原始語音特征信息,對MFCC原始語音特征信息進行深度語音特征提取,獲得深度語音特征信息,并將深度特征信息對應的控制信號標識信息發送給互聯網連接模塊;
遠程GPU服務器對深度語音特征信息進行分類,得到該深度語音特征信息對應的類別,并檢測該類別是否對應一種控制信號標識;若是,返回控制信號標識信息給互聯網連接模塊。