麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于用戶注冊信息的人機對話控制方法及系統與流程

文檔序號:11097785閱讀:361來源:國知局
一種基于用戶注冊信息的人機對話控制方法及系統與制造工藝

本發明涉及身份驗證的領域,特別涉及一種基于用戶注冊信息的人機對話控制方法及系統。



背景技術:

近年來,社會對于身份驗證問題的需求越來越迫切,尤其是在攜程、虛擬信用卡等安全問題爆發,各互聯網公司加強產品中的安全認證設施,國家開展網絡安全宣傳周以后,人們對于網絡認證的安全意識大大地增強。

用于驗證身份的特征主要是人臉、瞳孔、聲音等生物特征。而與其他生物特征相比,聲紋認證具有用戶接受程度高、設備成本低、方便采集等優勢,是非現場身份認證的首選,對于基于電話網絡的應用,是唯一的選擇,因此,聲紋認證在生物認證技術中占有非常重要的地位。

然而,盡管聲紋驗證具有如此多的優點,它也面臨著各種各樣的系統攻擊,其中最易施行、成本最低、也最有成效的一種攻擊是回放攻擊,就是錄制認證實體的真實語音樣本,然后攻擊者在認證的時候把聲音樣本回放出來,從而達到欺騙系統的目的。

為抵御錄音回防攻擊攻擊,需要采取人機挑戰-響應策略,由機器主導與用戶的對話,這帶來了以下幾個方面的難點:首先,為了保證系統提出的問題具有很高的隨機性,需要實現準備豐富的問題庫,問題涉及面廣,需要牽涉到語言學、心理學、人們日常生活習慣等,因此建設一個合格的問題庫具有很高的難度;其次,問題之間的關聯度也是一個問題,假如用戶需要回答一系列沒有關聯的隨機問題,這會極大的提高用戶的心理防御,用戶接受度低;第三,在人機會話不合拍的情況下,勉強地應對將影響發音質量,提升系統拒識概率,從而進一步提高人們的抗拒心理。



技術實現要素:

本發明的主要目的在于克服現有技術的缺點與不足,提供一種基于用戶注冊信息的人機對話控制方法及系統。該方法用于身份認證領域,提高機器挑戰的隨機性和人機對話的自然性,確保對話過程不易被錄音回放攻擊和用戶能順利依據機器的思路完成人機對話。

為了達到上述目的,本發明采用以下技術方案:

本發明基于用戶注冊信息的人機對話控制方法,包括下述步驟:

S1、控制基于概率的多層次話題狀態機跳轉至下一個子狀態;

S2、根據當前狀態從知識主題樹提取對話模板或知識素材;

S3、利用語句生成器將模板或素材轉換成文字語句;

S4、將文字語句合成為語音播放給用戶聽;

S5、等待并獲取用戶語音回答,將語音回復轉換成文字,并跳轉至S1。

作為優選的技術方案,步驟S1中,基于概率的多層次話題狀態機由用戶信息注冊器采集到的信息生成。

作為優選的技術方案,步驟S1中,基于概率的多層次話題狀態機由狀態和轉移概率組成,每一個狀態對應一類話題,而每個大狀態下又會派生出一層子狀態機,代表該大類話題下的細分子話題,而子狀態機又可以繼續派生出再下一層子狀態機,每個狀態之間有對應的轉移概率;部分狀態有一個入口問題集,進入這類狀態的子狀態機之前,會先向用戶提問入口問題,然后再依據用戶回答決定下一步跳轉。

作為優選的技術方案,步驟S1中,狀態跳轉的具體過程如下:

S11、初始化當前狀態Sc為當前層級狀態機的初始狀態;

S12、若Sc下沒有子狀態機,則將Sc作為提取知識主體樹的狀態;否則執行S13;

S13、從Sc開始,依據其所連弧線上概率轉移至下一級子狀態機中的任意一個狀態Sk,則此時Sc=Sk;

S14、若狀態Sc有入口問題集,則隨機選出一條問題詢問用戶,根據用戶回答選擇是否進入子狀態機,若是進入子狀態機,則Sc賦值為子狀態機的初始狀態,跳轉至步驟S12;

S15、若狀態Sc沒有入口問題集,則直接進入子狀態機,Sc賦值為子狀態機的初始狀態,跳轉至步驟S12。

作為優選的技術方案,步驟S2中,知識主題樹具體如下:

按樹狀劃分,主干為一級主題,主干繼續向下延伸,繼續往下細分二級、三級、...、n級主題,葉子主題為沒有任何子主題的主題,葉子主題下的內容由常規語句模板庫和擴展素材庫組成;

其中,所述常規語句模板庫由模板語句組成,模板語句采用模板語法進行編寫,模板結構有多選分支、可選分支和類別項三種;

所述擴展素材庫由一系列從互聯網搜集到的特定主題下簡單句組成,可以是時事素材、人物簡介或者代表某一主題下的知識。

作為優選的技術方案,步驟S2流程具體為:

S21、采用深度優先搜索從知識主題樹中搜索與當前狀態所屬話題相匹配的主題;

S22、搜索到與前狀態所屬話題相匹配的知識主題后,采用隨機選擇策略從該主題對應的常規語句模板庫選擇一條語句模板,或者從擴展素材庫選擇一個對話素材。

作為優選的技術方案,步驟S3中,將模板轉換成文字語句的策略為,針對不同模板結構,采用不同的替換操作:

(1)多選分支:替換時選擇根據用戶的身份信息選擇一個分支替代;

(2)可選分支:替換時可以選擇用這個分支,或者不用這個分支;

(3)類別項:替換時可以用該類別下的任意對象替換。

作為優選的技術方案,步驟S3中,將擴展素材轉換成文字語句的策略具體如下:

(1)針對人名進行轉換,利用實體命名工具找到素材句子中的人名,然后進行替換;

(2)針對地名進行轉換,利用實體命名工具找到素材句子中的地名,然后進行替換;

(3)針對原因進行轉換,把陳述句轉換成疑問句。

本發明還提供了一種基于用戶注冊信息的人機對話控制系統,包括:

用戶信息注冊模塊,用于采集用戶身份信息;

基于概率的多層次話題狀態機,利用用戶身份信息生成,用于控制人機對話過程中的話題轉換;

知識主題樹,用于存儲話題知識;

語句生成器,用于將語句模板或知識素材轉換成文字語句,由常規語句模板處理器和擴展素材處理器組成;

常規語句模板處理器,用于將常規語句模板轉換成普通文字語句;

擴展素材處理器,用于將擴展素材語句轉換成問題;

語音合成模塊,用于將文字語句合成為語音播放給用戶;

語音輸入模塊,用于錄取用戶語音輸入,并將其轉化成文字;

所述用戶信息注冊模塊、基于概率的多層次話題狀態機、知識主體樹、語句生成器以及語音合成模塊順序連接,所述語音輸入模塊與基于概率的多層次話題狀態機連接。

作為優選的技術方案,所述知識主體樹,按主題樹劃分,由常規語句模板庫和擴展素材庫組成;

常規語句模板庫,采用模板化技術,用于存儲與用戶登記信息直接相關的常規問題;

擴展素材庫,用于存儲從互聯網搜集的擴展性素材。

本發明與現有技術相比,具有如下優點和有益效果:

本發明的基于用戶注冊信息的人機對話控制方法可用于身份認證領域,根據用戶身份信息產生用戶所熟悉的對話內容,以一種自然親切的方式主導人機對話,在用戶防備心理較低的情況下采集用戶聲紋。

附圖說明

圖1示出本發明基于用戶注冊信息的人機對話控制方法一個實施例的流程圖;

圖2示出本發明基于用戶注冊信息的人機對話控制方法中基于概率的多層次話題狀態機的一個實施例的結構圖;

圖3示出本發明基于用戶注冊信息的人機對話裝置中用戶信息注冊模塊一個實施例的結構圖;

圖4示出本發明基于用戶注冊信息的人機對話控制方法中基于概率的多層次話題狀態機一個實施例的跳轉流程圖;

圖5示出本發明基于用戶注冊信息的人機對話控制方法中知識主題樹一個實施例的結構圖;

圖6示出本發明基于用戶注冊信息的人機對話裝置一個實施例的結構圖。

具體實施方式

下面結合實施例及附圖對本發明作進一步詳細的描述,但本發明的實施方式不限于此。

如圖1所示為本發明實施例的流程圖,包括下述步驟:

步驟11,控制基于概率的多層次話題狀態機跳轉至下一個子狀態;

步驟12,根據當前狀態從知識主題樹提取對話模板或知識素材;

步驟13,利用語句生成器將模板或素材轉換成文字語句;

步驟14,將文字語句合成為語音播放給用戶聽;

步驟15,等待并獲取用戶語音回答,將語音回復轉換成文字,并跳轉至步驟11。

根據本發明的優選實施例,步驟11中的狀態跳轉可以由基于概率的多層次話題狀態機執行。

如圖2所示為本發明基于用戶注冊信息的人機對話控制方法中基于概率的多層次話題狀態機的一個實施例的結構圖,為了直觀地闡述本發明涉及規則思想,圖2僅示出狀態機的一部分。

基于概率的多層次話題狀態機可以由狀態和轉移概率組成,如圖2所示,每一個圓圈代表一個狀態,每個狀態代表對應于一類話題,而每個狀態下又會有一層子狀態機,代表該類話題下的細分子話題,而子狀態機又可以繼續派生出下一層子狀態機;而弧線代表狀態轉移關系,弧線上的權重表示狀態之間的轉移概率。此外,子狀態可以有一個入口問題集,問題集內含多個入口問題,進入該狀態的子狀態機之前,會先向用戶提問入口問題,然后再依據用戶回答決定下一步跳轉。

基于概率的多層次話題狀態機由用戶信息注冊器采集到的信息生成,圖3為用戶信息注冊器的結構圖,用于采集用戶本身、妻子(假如有)、所有孩子(假如有)的年齡、籍貫、受教育程度、出生日期等信息。該裝置可以部署在一臺服務器上,用戶從互聯網訪問注冊頁面,填寫信息,并提交信息,然后用戶信息注冊器將信息保存至特定的存儲介質中。

圖4為基于概率的多層次話題狀態機的跳轉流程圖,包括以下步驟:

步驟31,初始化當前狀態變量Sc=S10,其中,表示第一層狀態機的初始狀態S10

步驟32,若Sc下沒有子狀態機,則返回狀態Sc,否則執行步驟33;

步驟33,從Sc開始,依據其所連弧線上概率轉移至下一級子狀態機中的任意一個狀態Sk,則此時Sc=Sk

步驟34,若狀態Sc有入口問題集,則選出一條問題詢問用戶,根據用戶回答選擇是否進入子狀態機,若是進入子狀態機,則Sc賦值為子狀態機的初始狀態Sj0;跳轉至步驟32;

步驟35,若狀態Sc沒有入口問題集,則直接進入子狀態機,Sc賦值為子狀態機的初始狀態Sj0;跳轉至步驟32。

舉例來說,用戶從第一層狀態機初始狀態S10開始跳轉至S14,進入愛好話題,由于S14沒有入口問題集,因此直接進入S14的下一層子狀態機,跳轉至子狀態機的初始狀態S20,然后跳轉至S22,進入旅游話題,由于S22同樣沒有入口問題集,因此直接進入S22的下一層子狀態機,跳轉至子狀態機的初始狀態S30,然后跳轉至S31,進入湖南話題,該狀態下有入口問題集,選擇一條用戶提問,如“你有去過湖南旅游嗎?”,若用戶回答“是”,則繼續進入S31,以此類推,一直深入至最底層的子狀態機。

圖5為知識主題樹的示例結構圖,按樹狀劃分,主干為一級主題,主干繼續向下延伸,開枝散葉,繼續往下細分二級、三級、...、n級主題,葉子主題為沒有任何子主題的主題。

根據本發明的優選實施例,步驟12中,根據當前狀態所屬話題從知識主題樹中搜索相匹配的主題,搜索方式可以采用深度優先搜索,從第一級主題開始和當前狀態所屬話題比較,若相同,則認為找到匹配主題,否則,繼續往下搜索,若遇到葉子主題,則應回溯至父級主題。

根據本發明的優選實施例,步驟12中,搜索到與前狀態所屬話題相匹配的知識主題后,可從該主題對應的常規語句模板庫選擇一條語句模板,或者從擴展素材庫選擇一個對話素材,選擇策略可以采用隨機選擇策略。

常規語句模板庫模板語句組成,模板語句采用模板語法進行編寫,模板結構有多選分支、可選分支、類別項三種,結構具體可參見下文。

擴展素材庫由一系列從互聯網搜集到的特定主題下簡單句組成,可以是時事素材,人物簡介等,代表某一主題下的知識。

根據本發明的優選實施例,步驟13中,語句生成器先對輸入作出判斷,若輸入為語句模板,則調用常規語句模板處理器進行處理;若輸入為對話素材,則調用擴展素材處理器進行處理。

常規語句模板處理器用于將語句模板中的模板結構替換為常規文字。本實施例的一種實現方式中,模板結構和對應的替換策略如下:

(1)多選分支:用“|”分隔各個選擇分支,替換時選擇根據用戶的身份信息選擇一個分支替代,例如“小學|中學”表明可以用“小學”或“中學”進行替代;

(2)可選分支:用“?”作為符號,替換時可以選擇用這個分支,或者不用這個分支,例如“(平時)?喜歡旅游嗎”,替換后可以變成“喜歡旅游嗎”,或者變成“平時喜歡旅游嗎”;

(3)類別項:用“<>”包含類型,替換時可以用該類別下的任意對象替換,例如“<運動>”,替換時可以用屬于“運動”類別的任意一個名詞替換,可以替換成“足球”或者“籃球”等等。

擴展素材處理器用于將擴展素材轉換成常規的問題,擴展素材從擴展素材庫獲取,擴展素材庫預先收錄從互聯網上摘錄下來的簡單句,本實施例的一種實現方式中,擴展素材處理器的轉換策略如下:

(1)針對人名進行轉換,可以利用實體命名工具找到素材句子中的人名,然后用“誰”進行替換,例如,“三國時,諸葛亮大擺空城計”,可將“諸葛亮”替換成“誰”,轉換結果為“三國時,誰大擺空城計”;

(2)針對地名進行轉換,可以利用實體命名工具找到素材句子中的地名,然后用“哪里”進行替換,例如,“廣交會在廣州舉行”,可將“廣州”替換成“哪里”,轉換結果為“廣交會在哪里舉行”;

(3)針對原因進行轉換,可以在陳述句前面加上“為什么”轉換成疑問句,例如,“海水是咸的”,加上“為什么”后,轉換結果為“為什么海水是咸的”。

圖6為實現本發明基于用戶注冊信息的人機對話方法的一個裝置圖,圖中表明了各模塊的連線關系,該裝置包括如下模塊:

用戶信息注冊模塊,用于采集用戶身份信息;

基于概率的多層次話題狀態機,利用用戶身份信息生成,用于控制人機對話過程中的話題轉換;

知識主題樹,用于存儲話題知識,按主題樹劃分,由常規語句模板庫和擴展素材庫組成;

常規語句模板庫,采用模板化技術,用于存儲與用戶登記信息直接相關的常規問題;

擴展素材庫,用于存儲從互聯網搜集的擴展性素材;

語句生成器,用于將語句模板或知識素材轉換成文字語句,由常規語句模板處理器和擴展素材處理器組成;

常規語句模板處理器,將常規語句模板轉換成普通文字語句;

擴展素材處理器,將擴展素材語句轉換成問題;

語音合成模塊,將文字語句合成為語音播放給用戶;

語音輸入模塊,錄取用戶語音輸入,并將其轉化成文字。

根據本發明的優選實施例,語音合成模塊和語音輸入模塊這兩個模塊可以采用開源庫或專用的語音-文字轉換芯片完成,也可以由實施方自行研發實現。

上述各功能模塊可以集成在一個處理模塊中,也可以是各個模塊單獨物理存在,也可以兩個或兩個以上模塊集成在一個模塊中。上述集成的模塊既可以采用硬件、存儲在存儲器中且由合適的指令執行系統執行的軟件或固件或它們的組合來實現。所述集成的模塊如果以軟件功能模塊的形式實現并作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。

上述實施例為本發明較佳的實施方式,但本發明的實施方式并不受上述實施例的限制,其他的任何未背離本發明的精神實質與原理下所作的改變、修飾、替代、組合、簡化,均應為等效的置換方式,都包含在本發明的保護范圍之內。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 英吉沙县| 喀喇| 茶陵县| 商洛市| 盐津县| 陕西省| 舟曲县| 石城县| 余干县| 常宁市| 灯塔市| 三亚市| 新龙县| 寿宁县| 乌拉特前旗| 姜堰市| 台北市| 福清市| 华池县| 凤庆县| 揭东县| 伽师县| 鹤峰县| 宁化县| 二手房| 法库县| 兴文县| 洪洞县| 高密市| 偃师市| 班玛县| 宜兰县| 股票| 白城市| 叶城县| 加查县| 镇沅| 阿拉善左旗| 抚顺县| 嘉义县| 东乡|