本發明涉及語音訓練和語音識別技術領域,尤其涉及一種用于電力終端的語音客服系統。
背景技術:
如今,電力客服運行系統為廣大的電力用戶提供了許多便利。2002年以來,全國統一的特服號“95598”服務全國電力用戶,24小時全天候受理電力故障報修、用電業務咨詢、供電服務質量投訴、用電業務申請、電費業務查詢和發布計劃檢修停電預報。95598呼叫中心具備上萬路進線,每小時接聽能力達到幾十萬次,為全國電力客戶提供各種電力服務。
對于電力客服運行系統而言,目前主要是靠接線員人工接聽電力用戶來電,根據與電力用戶通話交流給予用戶幫助和服務。
在電力客服運行系統中,接線員對于維持電力客服的正常運行至關重要。在實際工作中,接線員的工作任務往往異常繁重。接線員和用戶的理解難免會出現偏差,一旦發生錯誤,其后果往往是嚴重的。目前接線員的語音通話的訓練不足,導致系統服務質量下降。
技術實現要素:
為克服現有技術中存在的問題,本發明提供一種可用于電力終端的語音客服系統,具有接線員語音訓練裝置,該接線員語音訓練裝置能為接線員提供語音訓練,通過語音訓練建立接線員的個人聲學模型,利用個人聲學模型識別接線員的指令語音,并且對識別后的指令語音進行糾錯和規范,來提高語音識別的正確率,從而提高系統服務質量。
根據本發明的實施例的第一方面,提供了一種用于電力終端的語音客服系統,包括:接線員語音訓練裝置,接線員語音訓練裝置包括語音訓練器、語音識別器、識別后處理器和模擬機服務器,其中,語音訓練器與語音識別器連接,語音訓練器用于通過對接線員輸入的語音進行訓練,建立個人聲學模型;語音識別器與識別后處理器連接,語音識別器用于基于個人聲學模型,對接線員輸入的指令語音進行識別,將識別的結果輸出為文本信息;識別后處理器與語音訓練器和模擬機服務器連接,識別后處理器用于將文本信息與個人聲學模型進行動態匹配容錯處理,輸出XML形式的文本信息;模擬機服務器用于對XML形式的文本信息進行指令分析和應答。
根據本發明的一個實施例,模擬機服務器包括語音生成器,用于根據XML形式的文本信息生成語音提示來應答。
根據本發明的一個實施例,語音訓練器通過對接線員輸入的語音進行訓練以提取聲學特征信息、獲取統計信息,生成具有個人語音特征的個人聲學模型。
根據本發明的一個實施例,語音訓練器包括專用名詞語音訓練模塊、數字語音訓練模塊、字母語音訓練模塊,專用名詞語音訓練模塊、數字語音訓練模塊和字母語音訓練模塊分別通過對接線員輸入的專用名詞語音、數字語音和字母語音進行訓練,生成具有個人語音特征的專用名詞聲學模型、數字聲學模型和字母聲學模型。
根據本發明的一個實施例,語音識別器包括特殊發音識別模塊,用于基于專用名詞聲學模型、數字聲學模型和字母聲學模型,來識別接線員輸入的指令語音中的專用名詞語音、數字語音和字母語音。
根據本發明的一個實施例,接線員語音訓練裝置還包括語音信息采集器和存儲緩沖區,語音信息采集器與語音訓練器連接,語音信息采集器還與語音識別器連接,用于采集接線員要輸入語音訓練器或語音識別器的語音,按照預定的采樣率、單/立體聲道、單位比特數將語音處理成語音信息并將語音信息保存在存儲緩沖區內。
根據本發明的一個實施例,預定的采樣率為16KHz,單位比特數為16比特,存儲緩沖區的大小為6400字節。
根據本發明的一個實施例,接線員語音訓練裝置還包括語音模型配置器,語音模型配置器與語音訓練器連接,語音模型配置器用于設計和配置不同客服階段的語音模型文法,以供語音訓練器選擇語音模型文法進行加載,進行不同客服階段的訓練。
根據本發明的一個實施例,接線員語音訓練裝置還包括初始化信息配置器,初始化信息配置器與語音識別器連接,初始化信息配置器用于為語音識別器配置初始化信息,初始化信息包括輸入輸出初始化信息、發音字典、個人聲學模型和/或運行初始化信息。
根據本發明的一個實施例,用于電力終端的語音客服系統還可以包括客服語音生成裝置,用于生成播放給電力用戶的客服語音。
由上可見,本發明實施例提供了一種用于電力終端的語音客服系統,包括:接線員語音訓練裝置,接線員語音訓練裝置包括語音訓練器、語音識別器、識別后處理器和模擬機服務器,其中,語音訓練器與語音識別器連接,語音訓練器用于通過對接線員輸入的語音進行訓練,建立個人聲學模型;語音識別器與識別后處理器連接,語音識別器用于基于個人聲學模型,對接線員輸入的指令語音進行識別,將識別的結果輸出為文本信息;識別后處理器與語音訓練器和模擬機服務器連接,用于將文本信息與個人聲學模型進行動態匹配容錯處理,輸出XML形式的文本信息;模擬機服務器用于對XML形式的文本信息進行指令分析和應答。由此可知,本發明的用于電力終端的語音客服系統具有接線員語音訓練裝置,該接線員語音訓練裝置能為接線員提供語音訓練,通過語音訓練建立接線員的個人聲學模型,利用個人聲學模型識別接線員的指令語音,并且對識別后的指令語音進行糾錯和規范,來提高語音識別的正確率,從而提高系統服務質量。
應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本發明。
附圖說明
此處的附圖被并入說明書中并構成本說明書的一部分,示出了符合本發明的實施例,并與說明書一起用于解釋本發明的原理。
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領域普通技術人員而言,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是根據本發明的一個實施例的用于電力終端的語音客服系統的結構示意框圖。
圖2是根據本發明的一個實施例的描述接線員訓練裝置進行指令語音識別的工作原理圖。
圖3是根據本發明的一個實施例的接線員訓練裝置的工作流程圖。
具體實施方式
這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發明相一致的所有實施方式。相反,它們僅是與如所附權利要求書中所詳述的、本發明的一些方面相一致的裝置和方法的例子。
圖1是根據本發明的一個實施例的用于電力終端的語音客服系統的結構示意框圖。語音客服系統可以集成在電力終端(例如,智能電能表)上,為電力用戶提供更優質的服務。如圖1所示,用于電力終端的語音客服系統包括接線員語音訓練裝置。接線員語音訓練裝置的目的在于,為電力語音客服系統的接線員提供日常語音學習和訓練,以便提高接線員在實際工作時的服務質量。根據本發明的一個實施例,語音訓練裝置為接線員提供語音訓練,通過語音訓練建立個人聲學模型,利用個人聲學模型識別接線員的指令語音,并將個人聲學模型與識別的指令語音進行動態匹配容錯處理,以糾正和規范接線員的指令語音,后續對指令進行分析和應答。如圖1所示,接線員語音訓練裝置可以包括語音訓練器1、語音識別器2、識別后處理器3和模擬機服務器4。語音訓練器1與語音識別器2連接,語音識別器2與識別后處理器3連接,識別后處理器3與語音訓練器1和模擬機服務器4連接。語音訓練器1通過對接線員輸入的語音進行訓練,建立個人聲學模型。語音識別器2基于個人聲學模型,對接線員輸入的指令語音進行識別,將識別的結果輸出為文本信息。識別后處理器3將文本信息與個人聲學模型進行動態匹配容錯處理,輸出XML形式的文本信息。模擬機服務器4對XML形式的文本信息進行指令分析和應答。
根據本發明的一個實施例,接線員可以通過麥克風輸入語音。接線員可以通過語音訓練器1訓練個人特色的聲學模型。訓練后,語音識別器2可以使用接線員的個人聲學模型進行語音識別。關于訓練,可以根據實際情況設定個人聲學模型訓練和建立計劃。個人聲學模型訓練和建立計劃可以特別包括指令語音訓練計劃。在指令語音訓練計劃下,接線員可以逐步訓練,熟練掌握指令語音的發音規范和發布流程。通過個人聲學模型訓練和建立計劃,接線員可以建立具備個人特色的個人聲學模型。個人聲學模型為后續的接線員語音識別提供識別基礎,基于接線員自己的個人特色的個人聲學模型來識別接線員自己的語音,可以大大提高語音識別率。根據本發明的實施例,經過訓練的聲學模型的識別效果明顯比未訓練時的識別率要高。
根據本發明的一個實施例,語音訓練器1可以通過對接線員輸入的語音進行訓練以提取聲學特征信息、獲取統計信息,生成具有個人語音特征的個人聲學模型。在電力客服領域,服務內容經常會涉及到專用名詞、地址、數字等重要的信息。因此,根據本發明的一個實施例,語音訓練器1可以包括專用名詞語音訓練模塊、數字語音訓練模塊、字母語音訓練模塊(未示出),專用名詞語音訓練模塊、數字語音訓練模塊和字母語音訓練模塊分別通過對接線員輸入的指令語音中的專用名詞語音、數字語音和字母語音進行訓練,生成具有個人語音特征的專用名詞聲學模型、數字聲學模型和字母聲學模型。相應地,根據本發明的一個實施例,語音識別器2可以包括特殊發音識別模塊,特殊發音識別模塊根據上述的數字聲學模型、字母聲學模型和專用名詞聲學模型,識別接線員輸入的指令語音中的數字特殊發音、字母特殊發音和專用名詞發音,以便提高識別正確率和效率。
如上所述,語音訓練器1通過對接線員輸入的語音進行訓練,建立個人聲學模型。語音識別器2基于個人聲學模型,對接線員輸入的指令語音進行識別,將識別的結果輸出為文本信息。具體地,文本信息可以是字符串形式。識別后處理器3將文本信息與個人聲學模型進行動態匹配容錯處理,輸出XML形式的文本信息。具體地,識別后處理器3主要是將識別出的字符串形式的文本信息進行解析重組(例如,將信息中的公司名、業務編號等具有特定含義的單詞替換成相應的數字或字母形式),基于個人聲學模型對解析重組后的文本信息進行動態匹配容錯處理后,輸出XML形式的文本信息,交給模擬機服務器4進行指令的分析、應答等處理。
如上所述,語音客服系統經過訓練后對指令語音的語音識別效率和正確率可以大大提高,再通過動態容錯匹配處理可以進一步有效地提高語音識別正確率。根據本發明的一個實施例,為了更進一步提高語音識別正確率,可以采用鼠標/鍵盤輔助輸入來進一步提高識別效率。
模擬機服務器4通過對XML形式的文本信息進行指令分析和應答,來為接線員模擬日常的指令發布環境。根據本發明的一個實施例,模擬機服務器4的指令應答可以是回饋給接線員語音提示,例如,類似于日常電力服務中電力終端上提示電力用戶操作的語音提示。為了回饋給接線員語音提示,如圖1所示,模擬機服務器4可以包括語音生成器41,用于根據所述XML形式的文本信息生成語音提示來應答。生成的語音提示可以播放給接線員,接線員可以及時地獲知語音指令發布是否正確,進而獲知自己的語音指令發音是否正確,以達到語音指令訓練和學習的目的。根據本發明的一個實施例,用于電力終端的語音客服系統還可以包括客服語音生成裝置,生成播放給電力用戶的客服語音。
根據本發明的一個實施例,如圖1所示,用于電力終端的語音客服系統還可以包括語音信息采集器5和存儲緩沖區(未示出),語音信息采集器5可以與語音訓練器1和語音識別器2連接。語音信息采集器5采集接線員要輸入語音訓練器1或語音識別器2的語音,按照預定的采樣率、單/立體聲道、單位比特數將語音處理成語音信息并將語音信息保存在存儲緩沖區內。根據本發明的一個實施例,預定的采樣率可以為16KHz,單位比特數可以為16比特,存儲緩沖區的大小可以為6400字節。
根據本發明的一個實施例,如圖1所示,接線員語音訓練裝置還可以包括初始化信息配置器6,初始化信息配置器6與語音識別器2連接,初始化信息配置器6為語音識別器2配置初始化信息,初始化信息可以包括輸入輸出初始化信息、發音字典、聲學模型和/或運行初始化信息等。
根據本發明的一個實施例,用于電力終端的語音客服系統還可以包括語音模型配置器7,語音模型配置器7可以與語音訓練器1連接,語音模型配置器7用于設計和配置不同客服階段的語音模型文法,以供語音訓練器1選擇語音模型文法進行加載,完成不同客服階段的訓練。
根據本發明的一個實施例,接線員通過指令語音來發布指令,以進行管制,涵蓋了維護、報警、收費、投訴等等多個不同業務管制場景。下面結合圖2描述接線員語音訓練裝置進行指令語音識別的工作原理圖。
根據本發明的一個實施例,如圖2所示,可以采用Sphinx-4語音識別引擎來配置語音識別器2,Sphinx-4語音識別引擎利用基于深度學習和隱馬爾可夫模型的語音識別技術來實施語音識別。當接線員選擇指令語音識別時,語音客服系統啟動時需要完成一系列的初始化操作,主要包括麥克風和耳機的檢測,訓練計劃的選擇,語音識別引擎初始化的連接等。尤其地,在Sphinx-4語音識別引擎開始工作前,要對Sphinx-4語音識別引擎實施初始化,具體地,為Sphinx-4語音識別引擎加載初始化配置信息,配置語音模型,選擇聲學模型,主要實現識別引擎初始化時,輸入輸出、發音字典、聲學模型和系統運行等配置信息的設計、管理、分析、動態加載及處理。初始化完成后,接線員可以自由控制麥克風的打開和關閉,通過麥克風輸入指令語音。語音信息采集器采集指令語音,輸出語音信息到Sphinx-4語音識別引擎。此時,Sphinx-4語音識別引擎接收并識別語音信息,輸出字符串形式的指令文本信息。識別后處理器3將識別后的文本信息與個人聲學模型進行動態匹配容錯處理,輸出XML形式的文本信息,交給模擬機服務器4進行指令的分析、應答等處理。模擬機服務器4可以生成語音提示來應答,接線員收到語音提示,可以及時地了解自己訓練的效果,做到取長補短,提高日常服務質量。
圖3是根據本發明的一個實施例的語音訓練裝置的工作流程圖。
如圖3所示,系統啟動后,接線員以自己注冊的賬號、密碼或游客的身份登陸接線員語音訓練裝置的系統,此時,接線員可以選擇語音訓練或指令語音識別。如果接線員首次使用語音訓練裝置的系統,建議先完成語音訓練以獲得具有個人語音特征的聲學模型,再選擇指令語音識別。如果接線員非首次登陸,可以二次訓練聲學模型,也可以直接進行語音識別。
如果接線員選擇語音訓練,系統啟動時將完成一系列的初始化操作,包括語音訓練計劃的選擇、聲學模型更新過程中數據的重置等。語音訓練初始化完成后,系統會自動顯示語音訓練的內容并加載上次訓練的記錄,接線員依據系統的提示決定是否繼續上次的訓練,之后通過麥克風錄入具有個人特色的語音信息。錄用過程中,為便于語音錄入錯誤信息后的調整,每次麥克風錄入一句話長度的語音信息。當前語句錄入完成后,接線員可以選擇當前訓練語句的重新錄音、暫停當前錄音或結束訓練。訓練結束后,會根據麥克風采集的多條語音信息提取聲學特征文件、獲取統計信息并最終生成具有個人語音特征的新的聲學模型,此時,整個語音訓練過程完成,同時新的聲學模型將作為指令語音識別的資源文件,存放在存儲緩沖區中的系統資源文件夾下。
訓練過程如下:接線員首先根據本次訓練的需要,選擇具體的訓練內容,例如,指令訓練、專用名詞訓練、數字訓練或字母訓練,然后,點擊開始當前指令錄音按鈕,接線員將當前行的內容按照發音要求通過麥克風語音錄入,再點擊當前指令錄音完畢按鈕,這樣,該行的語音信息錄入完成。接線員可以自己決定本次訓練語句的數量,也可以重新錄入之前一行的語音信息。最后,接線員點擊聲學模型更新按鈕,系統將自動完成聲學模型的訓練和更新。
如果接線員選擇語音識別,系統啟動時也需要完成一系列的初始化操作,主要包括麥克風和耳機的檢測,訓練計劃的選擇,語音識別引擎初始化的連接等。初始化完成后,接線員可以自由控制麥克風的打開和關閉。空管模擬訓練過程中,接線員打開麥克風語音輸入一條完整的指令后,關閉麥克風。此時,系統調用語音識別引擎Sphinx-4接收并識別語音,并輸出文本信息。之后,識別后處理器3對識別后的文本信息進行符合模擬機服務器4處理所需格式的替換處理,最后,對替換后的文本信息進行合法性的判斷,即,將替換后的文本信息與個人聲學模型進行動態匹配容錯處理,輸出XML形式的文本信息。之后,模擬機服務器4將XML形式的文本信息按照JavaCC編寫的詞法和語法規則解析成結構化的指令,以便模擬機服務器4對指令進行應答。至此,一次完整的人機模擬陸空通話的過程完成,而對于判斷不合法的,則會要求接線員重新發布指令語音。
綜上所述,本發明的用于電力終端的語音客服系統具有接線員語音訓練裝置,該接線員語音訓練裝置能為接線員提供語音訓練,通過語音訓練建立接線員的個人聲學模型,利用個人聲學模型識別接線員的指令語音,并且對識別后的指令語音進行糾錯和規范,來提高語音識別的正確率,從而提高系統服務質量。
本領域技術人員在考慮說明書及實踐這里發明的公開后,將容易想到本發明的其它實施方案。本申請旨在涵蓋本發明的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本發明的一般性原理并包括本發明未公開的本技術領域中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的,本發明的真正范圍和精神由下面的權利要求指出。