本發明涉及會話評價裝置和方法、以及存儲用于執行會話評價方法的程序的存儲介質。
背景技術:
迄今為止,已經提出了一種用于通過分析由說話者發出的語音本身來分析說話人的心理狀態等的技術。例如,專利文獻1提出了這樣一種技術,該技術用于通過獲取說話者的語音序列并檢測存在于語音序列中的基音的間隔(音程)來診斷說話人的心理狀態、健康狀態等。
現有技術文獻
專利文獻
專利文獻1:日本專利no.4495907
在至少兩個人或說話人之間的會話中,當一個說話者已給出詢問(說出的話)時,另一說話者對該詢問(說出的話)發出一些回答(包括反饋語回復(backchannelfeedback))。在那時,給會話參與方的印象會根據以哪種氛圍或細微差別(即,非語言特性)發出回答而不同,甚至在以相同措辭發出回答的情況下也是如此。因此,在上述專利文獻1中所提出的技術構造為通過檢測說話者的語音序列中的音程(音高間隔)來分析說話人的心理狀態等。即,在專利文獻1中所提出的技術既不將兩個人之間的會話中的詢問的語音特性與回答的語音特性進行比較,也不評價對特定詢問所做出的回答的非語言特性。因此,在專利文獻1中所提出的技術無法評價對會話中已經發出的特定詢問的回答具有哪種非語言特性。
技術實現要素:
鑒于上述現有技術問題,本發明的目的是提供能夠以客觀方式評價對詢問的回答的非語言特性(例如,該回答給已發出詢問的會話參與方的印象是好還是壞)的會話評價裝置和方法、以及存儲用于執行會話評價方法的程序的存儲介質。
在評價會話中的對詢問的回答時,首先考慮在人與人之間進行了何種會話(對話),從而關注除了語言信息外的信息,特別是表征會話的聲音音高(頻率)。作為人與人之間的示例性對話,考慮了一個人(“人b”)對另一人(“人a”)給出的話語(例如,詢問)作出回答的情況。在這樣的情況下,當“人a”已發出詢問時,不僅“人a”往往會對詢問的特別部分的音高具有強烈印象,而且對該詢問作出回答的“人b”往往也會對詢問的特別部分的音高具有強烈印象。當“人b”以同意、許可、確認等為意圖對詢問作出回答時,這個人以表征回答的部分的音高與所述詢問的上述讓人印象深刻(已給人強烈印象)的音高具有特定關系(更具體地,協和音程關系)的這種方式來說出回答的語音(回答語音)。由于“人a”的詢問的讓人印象深刻的音高和表征“人b”對詢問的回答的部分的音高具有上述關系,因此聽到了回答的“人a”會對“人b”的回答具有良好、舒適且安心的印象。即,可以認為,在人與人之間的實際對話中,詢問的音高和對該詢問的回答的音高具有如上所述的特定關系,而不是彼此無關。因此,為了鑒于上述考慮而實現上述目的,本發明的發明人研發了一種被構建為以下文所述方式來適當地評價對詢問的回答的改進的會話評價系統。
即,為了實現上述目的,本發明提供了一種改進的會話評價裝置,其包括:接收部,其配置為接收與詢問的語音有關的信息和與對該詢問的回答的語音有關的信息;分析部,其配置為基于由接收部接收到的信息來獲取詢問的代表性音高和回答的代表性音高;以及評價部,其配置為基于由分析部獲取的詢問的代表性音高與回答的代表性音高之間的比較來評價對詢問的回答。
由于回答的音高相對于詢問的音高的音程(音高間隔)與會通過回答給發出了該詢問的會話參與方的印象具有緊密關系,因此通過根據本發明的原理將詢問的代表性音高與回答的代表性音高之間進行比較,能夠以客觀方式且高可靠性地評價對詢問的回答的非語言特性(例如,該回答給發出了詢問的會話參與方的印象是好還是壞)。
在本發明的一個實施例中,評價部可以配置為確定由分析部獲取的詢問的代表性音高與回答的代表性音高之間的差值是否在預定范圍內;當差值不在預定范圍內時,以一個八度音接一個八度音的方式確定音高偏移量,以使得差值落入預定范圍內;以及使詢問的代表性音高和回答的代表性音高中的至少一個偏移音高偏移量,并且基于在以音高偏移量進行音高偏移之后的詢問的代表性音高與回答的代表性音高之間進行的比較來評價對詢問的回答。即,根據本發明,當詢問的音高和回答的音高彼此相差超出預定范圍時,以一個八度音接一個八度音的方式來執行音高偏移控制,以使得詢問與回答之間的音高差落入預定范圍內,從而能夠適當地進行詢問的音高與回答的音高之間的比較。因此,即使在詢問的語音音高與回答的語音音高如同在男人與女人之間或成年人與小孩之間的會話中的那樣彼此相差了一個八度音程以上的情況下,也能夠以適當方式評價對詢問的回答。在本發明的一個實施例中,評價部可以配置為根據或基于詢問的代表性音高與回答的代表性音高之間的差與預定參考值相差多少來評價對詢問的回答。
在本發明的一個實施例中,會話評價裝置還可以包括檢測會話間隔的會話間隔檢測部,該會話間隔是從詢問的結束到回答的開始的時間間隔,并且評價部可以配置為還基于由會話間隔檢測部檢測到的會話間隔來評價對詢問的回答。另外,作為對詢問的回答的除了音高外的語音特性,從詢問的結束到回答的開始的時間間隔(會話間隔)與通過回答給會話參與方的印象具有緊密關系。因此,本發明可以通過還評價詢問與回答之間的會話間隔來更加高可靠性地評價回答。
本發明可以不僅被構造且實現為以上所述的裝置或設備,而且還可以被構造且實現為方法發明。此外,本發明可以被布置并實現為可由諸如計算機或dsp(數字信號處理器)的處理器執行的軟件程序、以及存儲這樣的軟件程序的非暫時性計算機可讀存儲介質。在這樣的情況下,該程序可以以存儲介質的形式被提供給用戶并且隨后安裝到用戶的計算機中,或者替選地,經由通信網絡從服務器設備傳遞到客戶端的計算機并隨后安裝到客戶端的計算機中。另外,在本發明中所采用的處理器可以是設置有專用硬件邏輯電路的專用處理器,而不是僅限于計算機或能夠運行期望軟件程序的其它通用處理器。
應該理解,本文中所使用的術語“詢問”不僅指的是“問詢(inquiry)”而且還純粹地指對另一人(會話參與方)“說出的話語”,并且本文中所使用的術語“回答”指的是對這樣的“詢問”(說出的話語)的某種語言回應。簡而言之,在兩個以上的人之間的會話中,一個人對另一人的話語被稱為“詢問”,而其他人對詢問的語音回應被稱為“回答”。
附圖說明
下文中,將參照附圖僅以示例的方式詳細地描述本發明的某些優選實施例。
圖1是示出了根據本發明的第一實施例的會話評價裝置的構造的框圖;
圖2是在圖1所示的會話評價裝置中所執行的示例性主例程處理的流程圖;
圖3是圖2所示的會話評價子例程的流程圖;
圖4是示出在第一實施例中的詢問的示例性音高和回答的示例性音高的示圖;
圖5是這樣一種示圖,該示圖示出了第一實施例中的詢問的示例性音高和回答的示例性音高,并且更具體地示出了詢問與回答之間存在一個八度音以上的音高差的情況;
圖6是在第一實施例中的用于計算音高評價點的規則的說明圖;
圖7是在第一實施例中的用于計算會話音程評價分數的規則的具體示例的說明圖;
圖8是示出根據本發明的第二實施例的會話評價裝置的構造的框圖;
圖9是在圖8所示的會話評價裝置中所執行的示例性主例程處理的流程圖;
圖10是示出根據本發明的第三實施例的會話評價裝置的構造的框圖;以及
圖11是在圖10所示的會話評價裝置中所執行的示例性主例程處理的流程圖。
具體實施方式
<第一實施例>
圖1是示出根據本發明的第一實施例的會話評價裝置10的構造的示圖。在下文中將會話評價裝置10描述為應用于如下的會話訓練裝置,所述會話訓練裝置經由單語音輸入部102的麥克風輸入兩個人之間的會話的語音,評價會話中的對詢問的回答,并且顯示所評價的回答。這里假設的對詢問的回答的示例包括答案和反饋語回復(感嘆詞),比如,“是”、“否”、“嗯啊”、“嗯...”、“好吧...”以及“我明白了”。
如圖1所示,會話評價裝置10包括cpu(中央處理單元)、存儲部、單語音輸入部102、顯示部112和其它部件,其中,存儲部包括存儲器、硬盤裝置等。在會話評價裝置10中,通過cpu執行預先安裝的應用程序來如下地構建多個功能塊。更具體地,在會話評價裝置10的第一實施例中,構建有語音獲取部104、分析部106、判定部108、語言數據庫122、會話間隔檢測部109和評價部110。
雖然在附圖中未具體示出,但是會話評價裝置10還包括操作輸入部等,以使得用戶可以向該裝置輸入各種操作,進行各種設置等。另外,會話評價裝置10的應用并非限于會話訓練裝置,本發明的會話評價裝置10可以應用于終端裝置(比如,智能電話或便攜式電話、平板型個人計算機等)。另外,會話評價裝置10可以應用于經由單語音輸入部102的麥克風輸入三個以上的人的會話語音的情況。在這樣的情況下,當一個人發出了詢問時,例如,其他人中的任一個可以對該詢問作出回答。
雖然未詳細地描述,但是語音輸入部102包括將輸入語音轉換成電信號的麥克風以及實時地將轉換后的語音信號轉換成數字信號的a/d轉換部。語音獲取部104接收從語音輸入部102輸出的數字信號,并且將所接收到的數字信號暫時存儲到存儲器中。在第一實施例中,語音輸入部102和語音獲取部104共同起到接收部的作用,該接收部配置為接收與詢問的語音有關的信息和與對該詢問的回答的語音有關的信息。
分析部106對轉換后的數字語音信號執行分析處理以提取話語(詢問和回答)的語音特性(音高、音量等),并且分析部106構造或配置為獲取詢問的代表性音高和回答的代表性音高。作為示例,分析部106包括:第一音高獲取部106a,其檢測詢問的特定部分的音高,并且基于該檢測來獲取詢問的語音特性(通常為代表性音高);以及第二音高獲取部106b,其檢測回答的話音中所包括的音高,并且基于該檢測來獲取回答的語音特性(通常為代表性音高)。
第一音高獲取部106a檢測詢問的語音信號中從說話開始持續到說話結束的說話部分的濁音段(voicedsegment)中的特定部分的音高(即,詢問的代表性音高),然后向評價部110提供指示所檢測到的詢問的音高(代表性音高)的數據。說話部分的濁音段中的特定部分是適于提取詢問所具有的音高相關特性的代表性部分。作為示例,特定部分(代表性部分)是緊接在說話結束之前的預定持續時間(例如,180毫秒)的末尾部分,并且第一音高獲取部106a對末尾部分中的作為代表性音高的最高音高進行檢測。這樣的特定部分(代表性部分)不限于末尾部分,可以是整個說話部分或說話部分中的一部分。替選地,除最高音高之外,可以檢測特定部分(代表性部分)中的最低音高或平均音高等作為代表性音高。
在如本實施例中的那樣實時地輸入語音的情況下,可以例如通過確定語音信號的音量已達到閾值以上來識別語音說話的開始,并且可以例如通過確定語音信號的音量已經持續在閾值以下達到預定時間段來識別語音說話的結束。應注意,為了防止喋喋不休,可以使用多個閾值來賦予滯后特性。另外,術語“濁音段”是指可檢測到語音信號的音高的說話部分的區段。這樣的音高可檢測區段意味著語音信號具有周期部分并且該周期部分中的音高是可檢測的。
如果詢問的濁音段的末尾部分是清音(即,不涉及聲帶的振動的聲音),則可以根據前一濁音部分來估計清音的音高。另外,詢問的特定部分(代表性部分)不一定限于濁音段的末尾部分,也可以是例如濁音段的話語開始部分。另外,可以做出這樣的布置:允許用戶按照期望設定應該識別詢問的哪個部分的音高。作為另一替選方案,僅可以將音量和音高中的一個而非將音量和音高兩者用于濁音段檢測,并且用戶可以選擇音量和音高中的哪一個應該用于濁音段檢測。
第二音高獲取部106b基于回答的語音信號來檢測回答的音高,并且基于所檢測到的音高來獲取回答的語音的代表性音高(例如,說話部分的平均音高)。然后,第二音高獲取部106b向評價部110提供指示所獲取的回答的代表性音高的數據。應注意,第二音高獲取部106b可以獲取回答的語音的整個區間或預定的部分區間中的最高音高或最低音高而不是所述平均音高來作為代表性音高。替選地,第二音高獲取部106b可以獲取回答的語音的預定部分區間中的平均音高作為代表性音高。作為另一替選,第二音高獲取部106b可以獲取回答的語音的整個區間或預定的部分區間中的音高軌跡本身作為代表性音高。
另外,在執行與第一音高獲取部106a和第二音高獲取部106b有關的處理時,分析部106可以通過使用經由語音獲取部104而被存儲到存儲器中的語音信號來檢測特定部分和該特定部分的音高。替選地,分析部106可以通過使用經由語音獲取部104而實時地接收到的語音信號來檢測詢問的音高。例如,在要實時地對詢問的音高進行檢測的情況下,將所輸入的語音信號的音高與前一語音信號的音高進行比較,并且以更新方式存儲所比較的音高中的較高音高。繼續這樣的操作直到詢問的話語結束為止,使得最終更新的音高被識別為詢問的音高。以該方式,可以將直到話語結束為止所檢測到的最高音高識別為詢問的音高。另外,在要對回答的音高進行檢測的情況下,可以基于回答的音節來識別回答的音高。在回答是反饋語回復的情況下,例如,在回答的第二音節中或附近的音高往往接近整個回答的平均音高,因此,可以將在第二音節的開頭處的音高識別為回答的音高。
判定部108對被轉換為數字信號的話語的語音信號進行分析,對數字語音信號執行語音識別以將語音信號轉換為字符串,由此識別說出的話語的一個或多個詞的含義。因此,判定部108判定話語是詢問還是回答,然后向分析部106提供指示判定結果的數據。在判定話語的含義時,判定部108參考在語言數據庫122中預先創建的音素模型來判定話語的語音信號接近哪個音素,并且由此識別由語音信號定義的一個或多個詞的含義。隱馬爾科夫模型可以用作音素模型。
應注意,判定部108關于話語是詢問還是回答的判定可以基于非語言特性而進行,而不是基于以上闡述的語言含義分析來進行。例如,如果話語在其末尾部分具有升調,則可以確定為詢問。如果下一話語的語音具有兩個音節,則可以將下一話語確定為是反饋語回復形式的回答。通常,如果話語是詢問,則下一話語是對該詢問的回答。因此,判定部108至少能夠判定話語是否是詢問就足矣。在這樣的情況下,自動地將緊跟在已被判定為詢問的話語之后的話語視為對該詢問的回答。
順便一提的是,在兩個人之間的對話中對詢問作出回答的情況下,從詢問的結束到回答的開始的時間間隔(會話間隔)可以是除了音高外要考慮的一個因素。例如,當對一個人說出的似乎迫切要求二選一回答的詢問做出回答“否”時,回答人為了足夠謹慎通常會需要一段時間,好像停頓片刻一樣,這是經驗上常見的行為。另一方面,對于一個人說出的沒有迫切要求二選一回答的諸如“誰”、“什么”、“何時”、“哪里”、“為什么”或“如何”這樣的詢問,其他人有時會需要一段時間來回答具體內容。在任何情況下,如果從詢問的結束到回答的開始的時間間隔相對較長,則可能給說出了詢問的人一種不舒服的感覺,而且隨后的會話可能不會變得活躍。相反,如果從詢問的結束到回答的開始的時間間隔太短,則說出了詢問的人可能會有這樣一種感覺:仿佛其他人的回答有意地疊蓋該詢問或者仿佛其他人沒有認真地聆聽說出了詢問的人。因此,可能給說出了詢問的人不舒服的感覺。
鑒于上述狀況,本實施例以如下這樣的方式構造:在評價對詢問的回答時,除了測量并評價音高外,還可以測量并評價從詢問的結束到回答的開始的時間間隔(也稱為“會話間隔”)。更具體地,會話間隔檢測部109通過使用內置于會話評價裝置10中的定時器或實時時鐘來檢測從詢問的結束到回答的開始的時間間隔(會話間隔)。在定時器用于計時目的的情況下,定時器響應于詢問的結束而開始計時,并且響應于回答的開始而停止計時,使得詢問的結束與回答的開始之間的時間間隔被檢測為會話間隔。在實時時鐘用于計時目的的情況下,獲取詢問的結束和回答的開始的各自的時間,然后將兩個時間之間的時間間隔檢測為會話間隔。指示所檢測到的會話間隔的時間數據被提供至評價部110,以便通過評價部110以及前面所述的詢問和回答的音高數據來評價時間數據。
評價部110基于從分析部106提供的詢問和回答的音高數據以及從會話間隔檢測部109提供的時間數據來評價對詢問的回答,并且由此計算評價點或分數。更具體地,對于音高數據,評價部110計算詢問的代表性音高與回答的代表性音高之間的差(音程),并且基于所算出的差(音程)與預定參考值相差多少來計算音高評價分數。同樣地,對于指示會話間隔的時間數據,評價部110基于會話間隔的時間長度與預定參考值(參考時間間隔)相差多少來計算會話間隔評價分數。然后,評價部110計算音高評價分數與會話間隔評價分數之和,并將該和作為回答的最終評價分數,并且在顯示部112上直觀地顯示該最終評價分數。因此,已做出回答的人可以檢查回答的評價。稍后將討論評價部110對回答進行評價的詳情。
接下來,將給出關于會話評價裝置10的第一實施例的操作的描述。圖2是示出會話評價裝置10的第一實施例中所執行的處理的流程圖。會話評價裝置10的cpu響應于用戶執行預定操作(例如,在主菜單畫面(未示出)上選擇與處理相對應的圖標等)而啟動與該處理相對應的應用程序。通過執行該應用程序,cpu構建圖1所示的功能塊。
這里,將關于以下情況來描述會話評價裝置10的操作:經由單話音輸入部102的麥克風輸入兩個人之間的自然會話的語音,并且會話評價裝置10在實時地獲取語音的特性的同時對詢問的回答進行評價。在像這樣經由單話音輸入部102輸入自然會話的情況下,需要判定話語是否是詢問,因為無法經由單話音輸入部102清楚地識別話語是否是詢問。這里,為了便于描述,做了這樣的假設:如果話語已被確定為詢問,則自動地將緊接在該詢題之后的話語視為是回答,因而不執行關于緊接在后的話語是否是回答的特定判定處理。然而,會話評價裝置10不限于此,并且可以被構造為執行用于確定緊接在已被確定為詢問的話語之后的話語是否是回答的特定判定處理。
首先,在步驟sa11處,將由語音輸入部102轉換的語音信號經由語音獲取部104提供給分析部106,在分析部106中進行關于話語是否已開始的判定。通過判定語音信號的音量是否已達到閾值以上來進行關于話語是否已開始的判定。應注意,語音獲取部104將語音信號存儲到存儲器中。
一旦在步驟sa11處確定了話語已開始,處理進行到步驟sa12,在步驟sa12處,分析部106的第一獲取部106a對經由語音獲取部104提供的語音信號執行音高分析處理,以獲取話語的音高作為語音特性。除非在步驟sa11處確定了話語已開始,否則就重復步驟sa11,直到確定話語已開始為止。
在步驟sa13處,分析部106通過判定具有等于或大于閾值的音量的語音信號是否仍持續來判定話語是否仍繼續。一旦在步驟sa13處確定了話語仍繼續,處理就倒退至步驟sa12,在步驟sa12處,分析部106的獲取部106a對語音信號執行音高分析處理以獲取話語的音高。另一方面,一旦在步驟sa13處確定了話語未繼續,處理就進行到步驟sa14,在步驟sa14中,通過判定部108做出關于最新的話語是否已經被確定為詢問的判定。如果根據步驟sa14處的判定確定了最新話語不是詢問,則處理倒退至步驟sa11以等待下一話語的開始。
另一方面,如果根據步驟sa14處的判定確定了最新的話語是詢問,則在步驟sa15處例如通過判定語音信號的音量低于預定閾值的狀態是否持續了預定時間來做出關于話語(詢問)是否已結束的判定。
如果根據步驟sa15處的判定確定了話語(詢問)尚未結束,則處理倒退至步驟sa12,以使得用于獲取話語的音高的音高分析處理得以繼續。一旦第一音高獲取部106a通過對語音信號執行分析處理獲取了話語(詢問)的高音(例如,話語結尾部分中的最高音高),第一音高獲取部106a就將詢問的音高數據提供至評價部110。
另一方面,如果根據步驟sa15中的判定確定了話語(詢問)已結束,則處理就進行到步驟sa16,在步驟sa16處,會話間隔檢測部109開始對會話間隔的時間長度進行計時。
然后,在步驟sa17處,做出關于對詢問的回答是否已開始的判定。由于詢問已結束,因此下一話語是回答,因而,通過判定在詢問的結束之后緊跟著的語音信號的音量是否已達到閾值以上來判定回答是否已開始。
如果根據步驟sa17處的判定確定了回答已開始,則在步驟sa18處,會話間隔檢測部109停止對會話間隔的時間長度進行計時。以上述方式,可以測量從詢問的結束到回答的開始的會話間隔的時間長度。然后,會話間隔檢測部109向評價部110提供指示所測量的會話間隔的時間長度的數據。
在步驟sa19處,分析部106的第二音高獲取部106b對來自語音獲取部109的語音信號執行分析處理,以獲取回答的音高作為語音特性。
在下一步驟sa20處,例如通過判定語音信號的音量低于預定閾值的狀態是否持續了預定時間來做出如在步驟sa15處所執行的關于回答是否已結束的判定。
如果根據步驟sa20處的判定確定了回答尚未結束,則處理倒退至步驟sa19,在sa19處,繼續用于獲取回答的音高的音高分析處理。一旦第二音高獲取部106b通過對語音信號執行分析處理獲取了回答的音高(例如,平均音高),第二音高獲取部106b就將回答的音高數據提供至評價部110。一旦在步驟sa20處確定了回答已結束,則處理倒退至步驟sa21,在步驟sa21處,評價部110對會話進行評價。
圖3是示出在圖2的步驟sa21處的會話評價處理的詳情的流程圖。首先,在步驟sb11處,評價部110基于從第一音高獲取部106a獲取的詢問的音高數據與從第二音高獲取部106b獲取的回答的音高數據,計算詢問的音高(代表性音高)與回答的音高(代表性音高)之間的差值;上述差值(音高差值)是通過從詢問的音高中減去回答的音高而算出的音高差值的絕對值。
在下一步驟sb12處,評價部110判定所算出的音高差值是否在預定范圍內。如果在步驟sb12處確定了所算出的音高差值在預定范圍之外,則在步驟sb13處,評價部110調整回答的音高。更具體地,評價部110以一個八度音接一個八度音的方式確定回答的音高的音高偏移量,使得音高差值落入預定范圍內(例如,一個八度音的范圍內)。然后,評價部110通過音高偏移量來調整回答的音高,此后,處理倒退至步驟sb11,以使得評價部110重新計算詢問的音高與調整或偏移后的回答的音高之間的音高差值。因此,即使在如同具有較高音高的自然語音的人(如女性或小孩)和具有較低音高的自然語音的人(如男性)之間的會話中那樣在人與人之間的自然語音中存在一個八度音以上的音高差的情況下,評價部110可以調整人與人之間的自然語音的音高差,從而適當地評價對詢問的回答。應注意,以該方式配置的評價部110可以適當地評價男性和女性之間的會話以及男性之間或女性之間的會話中的對詢問的回答,所述會話有時可能會涉及自然話音中的一個八度音以上的音高差。
在步驟sb13處,評價部110可以以一個八度音接一個八度音的方式調整回答的音高,直到音高差值落入預定范圍內(例如,在一個八度音的范圍內)。而已關于調整回答的音高而仍不調整詢問的音高的情況進行了以上描述,但本發明不限于此。可以調整詢問的音高而仍不調整回答的音高,或者可以調整問詢的音高和回答的音高這兩者。
如果根據步驟sb12處的判定確定了音高差值在預定范圍內,則在步驟sb14處,評價部110基于通過從詢問的音高減去回答的音高而算出的音高差值來計算音高評價點(分數)。此時,如果如上所述那樣在步驟sb13處已執行了音高調整,則評價部110使用基于調整后的音高而算出的音高差值來計算音高評價分數。由于音高差值是通過從詢問的音高中減去回答的音高而計算的,因此當回答的音高低于詢問的音高時,該音高差值變為正(加號)值,但當回答的音高高于詢問的音高時,該音高差值變為負(減號)值。其目的在于:相比于回答的音高高于詢問的音高的情況而言,對回答的音高低于詢問的音高的情況給予更高評價。在步驟sb14處根據或基于音高差值與預定參考值相差多少來計算音高評估分數。例如,假設預定參考值是700音分(cent),并且當音高差值為700音分時,給予滿分(100點)。在這樣的情況下,通過隨著音高差值與700音分參考值相差(偏離)更多而降低分數,來計算對詢問的回答的音高評價分數。即,音高評價分數越接近100點,對詢問的回答所進行的評價就越好。應注意,評價分數可隨著音高差值越接近預定參考值而增大。
然后,在步驟sb15處,評價部110基于指示從會話間隔檢測部109提供的會話間隔的時間數據來計算會話間隔評價分數。在步驟sb15處,基于從詢問的結束到回答的開始的會話間隔的時間長度與預定參考值相差多少來計算會話間隔評價分數。例如,假設預定參考值為180毫秒,并且當會話間隔的時間長度為180毫秒時給出滿分(100點)。在這種情況下,通過隨著會話間隔的時間長度與180毫秒參考值相差(或偏差)越多而增加分數,來計算會話間隔評價分數。即,會話間隔評價分數越接近100點,就可以越好地評價對詢問的回答。應注意,會話間隔評價分數可以隨著會話間隔的時間長度越接近預定參考值而增加。
然后,在步驟sb16處,評價部110基于對詢問的回答的音高評價分數與會話間隔評價分數來計算總評價分數。通過簡單地將音高評價分數與會話間隔評價分數加在一起來計算總評價分數。替選地,可以通過首先為音高評價分數和會話間隔評價分數添加預定的權重、然后將這樣加權后的音高評價分數和會話間隔評價分數相加在一起來計算總評價分數。
然后,在步驟sb17處,評價部110在顯示部112上顯示對詢問的回答的評價的結果(評價結果),此后,該處理回到圖2的步驟sa21。更具體地,在顯示部112上僅顯示作為評價結果的總評價分數。因而,能夠以客觀方式依據評價分數來檢查對詢問的回答的評價。應注意,音高評價分數和會話間隔評價分數可以獨立地顯示在顯示部112上,而不是僅顯示總評價分數。
另外,作為對詢問的回答的評價分數的顯示,不僅可以在顯示部112上顯示評價分數的數值,還可以顯示與評價分數相對應的圖形、符號或標記(比如,照明或動畫)。另外,可以以除了如上所述那樣視覺地顯示在顯示部112的屏幕上外的任意其它適當方式來指示或通知對詢問的回答的評價結果。例如,在會話評價裝置10應用于便攜式終端的情況下,可以使用振動功能或發聲功能來以與評價分數相對應的振動模式來使會話評價裝置10振動或者生成與評價分數相對應的可聽聲音來通知評價結果。
另外,在會話評價裝置10應用于諸如毛絨玩具或機器人的玩具的情況下,對詢問的回答的評價結果可以通過毛絨玩具或機器人的動作(姿勢)來指示或通知。例如,如果評價分數較高,則可以使得毛絨玩具或機器人做出開心的動作,而如果評價分數較低,則可以使得毛絨玩具或機器人做出失望的動作。以該方式,可以以更令人愉快的方式執行基于對詢問的回答的會話訓練。
以下將參考附圖更詳細地描述由本實施例中的評價部110執行的音高調整(在步驟sb12和sb13處)。更具體地,以下將在將詢問與回答之間的音高差值在一個八度音的范圍內(因而,將不執行音高調整)的情況和詢問與回答之間的音高差值不在一個八度音的范圍內(因而,將執行音高調整)的情況進行比較的同時描述音高調整。
圖4和圖5均是示出所輸入的詢問的語音與所輸入的對詢問的回答的語音之間的關系的示圖,其中,縱軸表示音高,而橫軸表示時間。更具體地,圖4示出了在詢問與回答之間的音高差值在一個八度音范圍內的情況下的關系,而圖5示出了在詢問與回答之間的音高差值沒有在一個八度音范圍內的情況下的關系。
另外,在圖4和圖5中,由附圖標記q指示的實線示意性地以直線示出了詢問的音高變化。附圖標記dq指示詢問q中的特定部分的音高(例如,詢問q中的話語結尾部分的最高音高)。另外,在圖4中,由附圖標記a指示的實線示意性地以直線示出了對詢問q的回答的音高變化,附圖標記da指示回答a的平均音高。附圖標記d指示詢問q的音高dq與回答a的音高da之間的差值。另外,在圖4中,附圖標記tq指示詢問的結束時間,附圖標記ta指示回答的開始時間。此外,附圖標記t指示tq與ta之間的時間間隔,即,從詢問q的結束到回答a的開始之間的時間間隔。
在圖5中,由附圖標記a’指示的虛線以直線示出了在經歷了偏移一個八度音的音高調整之后的回答a的音高變化。附圖標記da’指示這樣的調整過音高后的回答a’的平均音高。附圖標記d’指示詢問的音高dq與調整過音高后的回答a’的平均音高da’之間的差值。
在圖4的所示示例中,音高差值d在一個八度音(即,1200音分)范圍內,從而不需要音高調整。因此,在步驟sb11處計算音高差值d之后,在步驟sb14處基于通過從詢問q的音高dq中減去回答a的音高da而獲得的音高差值來計算音高評價分數,而沒有執行步驟sb13。由于回答a的音高da低于詢問q的音高dq,因此在這種情況下的音高差值是正(加號)值,因而與差值d相同。
另一方面,在圖5的所示示例中,由于音高差值d超過一個八度音(1200音分),因此需要音高調整。在圖5的所示示例中,如在具有較高自然語音的一個人說出詢問q而具有比說出詢問q的人的自然語音低一個八度音以上的自然語音的另一人說出回答的情況下一樣,回答a的音高遠遠低于詢問q的音高。因此,即使當兩個人以相同音高說出相同語音時,如果兩個人各自的自然語音之間存在一個八度音以上的音高差,則只要是利用未經調整的音高差對回答進行評價,回答的評價分數就會由于各自的自然語音的這種音高差而極大地不同,從而使得對回答的評價可能不合理。因此,在本實施例中,在圖3的步驟sb13處通過將回答a的音高da向上偏移一個八度音r來將回答a的音高da調整為回答a’的音高da’。因此,詢問q的音高dq與這樣調整后的回答的音高da’之間的音高差值d’減小到一個八度音(1200音分)范圍內。以該方式,能夠使人的語音機制的影響最小化,從而計算適當的音高評價分數。應注意,音高調整可以通過如下方式執行:以一個八度音接一個八度音的方式將回答的音高向下偏移,而不是如上那樣以一個八度音接一個八度音的方式將回答的音高向上偏移。
以下將參照附圖更詳細地描述在由本實施例中的評價部110(在步驟sb14處)執行的音高評價分數計算。圖6是說明用于計算音高評價分數的方案或規則的示圖,其中,橫軸表示詢問與回答之間的音高差值d,而縱軸表示音高評價分數。在圖6中,附圖標記d0表示音高差值的參考值(例如,700音分)。圖6中的實線指示用于音高評價分數計算的基準線。用于音高評價分數計算的基準線被表示為直線,以使得隨著音高差值d在音高差值d相對于音高參考值增大的方向上或者在音高差值d相對于音高參考值d0減小的方向上偏離音高參考值d0更多,音高評價分數減小。更具體地,以在距基準值d0預定范圍之外(即,在從下限值dl到上限值dh的范圍之外)音高評價分數變為零的方式,來設置用于音高評價得分計算的基準線。因此,如果假設例如當音高差值等于參考值d0時將音高評價分數計算為滿分(100點),則音高評價得分隨著音高差值在預定范圍(即,從下限值dl到上限值dh的范圍)內與參考值d0偏差更多而減小,并且當音高差值在預定范圍之外(即,在從下限值dl到上限值dh的范圍之外)時,將音高評價分數計算為零。應注意,盡管在圖6中將用于音高評價分數計算的參考線示出為相對于與縱軸平行的虛擬直線具有線對稱形狀并且經過參考值d0,但是用于音高評價分數計算的基準線不一定具有線對稱形狀。例如,用于音高評價分數計算的基準線的直線可以在參考值d0之前的直線的區域與在參考值d0之后的直線的區域之間不同地(以不同角度)傾斜。另外,用于音高評價分數計算的基準線不一定是直線,也可以是曲線。此外,用于音高評價得分計算的基準線可以具有非線性形狀而不是線性形狀。
假設這樣一種情況:在通過使用圖6所示的用于音高評價分數計算的基準線來計算音高評價分數時,通過從詢問q的音高中減去回答a的音高而算出的音高差值為“dx”。在該情況下,與根據用于音高評價分數計算的基準線而計算得到的值dx相對應的sdx變為加入點或減去點。因此,假設初始音高評價分數為零點,則可以通過將加入點與初始零點分數相加或者從初始零點分數減掉減去點來計算音高評價分數。
優選的是,將音高差值的參考值d0設置為使得對詢問的回答具有最佳音高。在本實施例中,如上所述那樣將參考值d0設置為700音分,這是使得回答的音高比詢問的音高低了約五度(即,使得回答的音高與詢問的音高為協和音程關系)的音高差值。即,優選的是,參考值d0被設置為使得回答的音高與詢問的音高具有協和音程關系的音高差值。由于一般在人與人之間的會話中,當一個人對另一人提出的詢問給出完全肯定的回答并且通過從詢問的音高中減去回答的音高而算出的音高差值更接近協和音程關系時,可以使得回答是給予良好、舒服且安心的印象的更適當的回答。因此,通過從詢問的音高減去回答的音高而算出的音高差值越接近參考值,就可以越好地評價對詢問的回答。此外,應注意,回答的音高與詢問的音高的關系不一定限于回答的音高比詢問的音高低了約五度,可以是除了所述的回答音高比詢問音高低了約五度之外的任何其它協和音程關系,比如純八度、純五度、純四度、大三度或小三度、大六度或小六度。另外,回答的音高與詢問的音高的關系不一定限于這樣的協和音程關系,并且可以是非協和音程關系,這是因為憑經驗知道某些非協和音程關系能夠賦予良好印象。
以下將參照附圖更詳細地描述由本實施例中的評價部110執行的會話間隔分數計算(在步驟sb15處)。圖7是說明用于計算會話間隔評價分數的方案或規則的具體示例的示圖,其中,橫軸表示會話間隔的時間長度t,縱軸表示會話間隔評價分數。在圖7中,附圖標記t0指示會話間隔評價(也稱為“參考時間間隔”)的參考值(例如,180毫秒)。圖7中的實線以直線表示用于會話間隔評價分數計算的基準線,以使得隨著會話間隔的時間長度t在時間長度t增大的方向上或在時間長度t減小的方向上與參考值to偏離越多,會話間隔評價分數減小。更具體地,以在距參考值t0預定范圍之外(即,在從下限值tl到上限值th的范圍之外)會話間隔評價分數變為零,來設置用于會話間隔評價分數的基準線。因此,假設:當會話間隔的時間長度l等于參考值t0時將會話間隔評價分數計算為滿分(100點),會話間隔評價分數隨著時間長度tl在預定范圍(即,從下限值tl到上限值th的范圍)內與參考值t0偏差更多而減小,以及當時間長度tl在預定范圍之外(即,在從下限值tl到上限值th的以外的范圍)時,將會話間隔評價分數計算為零。應注意,在圖7中將用于會話間隔評價分數計算的基準線示出為相對于與縱軸平行的虛擬直線具有線對稱形狀并且經過參考值t0,而用于會話間隔評價分數計算的基準線不一定具有線對稱形狀。例如,用于會話間隔評價分數的基準線的直線可以在參考值t0之前的直線的區域與在參考值t0之后的直線的區域之間不同地(以不同角度)傾斜。另外,用于會話間隔評價分數計算的基準線不一定是直線,也可以是曲線。另外,用于會話間隔評價分數計算的基準線除了線性形狀外還可以具有非線性形狀。
假設這樣一種情況:在通過使用圖7所示的用于會話間隔評價分數計算的基準線來計算會話間隔評價分數時,從詢問q到回答a的會話間隔的時間長度為“tx”。在這種情況下,與根據用于會話間隔評價分數計算的基準線而計算出的值tx相對應的stx變為加入點或減去點。因此,假設初始會話間隔評價分數為零點,則可以通過將加入點與初始零點分數相加或者從初始零點分數減去減去點來計算會話間隔評價分數。
優選的是,將在從詢問的結束到回答的開始的區域中的最佳時間長度設置為會話間隔的時間長度的參考值t0。在本實施例中,參考值t0被設置為例如如上所述的180毫秒,這是因為180毫秒是使得對詢問的回答給會話參與方良好、舒服且安心的印象的會話間隔時間長度。因此,從詢問的結束到回答的開始的會話間隔的時間長度越接近參考值t0,就可以越好地評價對詢問的回答。
音高差值的參考值d0和會話間隔時間長度的參考值t0(即,參考時間間隔t0)中的每一個均不一定限于用于評價對詢問的完全肯定的回答的參考值。即,可以根據對詢問的特定類型的回答(比如,具有如憤怒反應或冷淡反應的特殊感受的回答)來改變會話間隔時間長度的參考值t0,使得可以根據回答類型更加適當地評價回答。在評價憤怒的回答時,例如,可以使得會話間隔時間長度的參考值t0比用于完全肯定的回答的參考值(180毫秒)更短。以該方式,可以評價對詢問的回答的憤怒程度。另外,在評價冷淡的回答時,可以使得會話間隔時間長度的參考值t0比用于完全肯定的回答的參考值(180毫秒)更長。以該方式,可以評價對詢問的回答的冷淡程度。
另外,可以與上述的各種類型的回答相關聯地提供音高差值的多個前述參考值d0和會話間隔時間長度的多個參考值t0。例如,可以分別提供用于完全肯定的回答的參考值(參考時間間隔)、用于憤怒回答的參考值(參考時間間隔)和用于冷淡回答的參考值(參考時間間隔)。
另外,可以將音量和音高評價為詢問和回答的語音特性。更具體地,將詢問和回答的各自的音量獲取為詢問和回答的語音特性,計算詢問的音量與回答的音量之間的差值,并且基于所算出的差值與預定參考值相差多少來計算音量評價分數。將這樣算出的音量評價分數與上述的音高評價分數和會話間隔評價分數相加,從而計算總評價分數。也可以根據回答的類型來改變音量差值的上述參考值(參考音量值),或者可以與不同類型的回答相關聯地提供多個這樣的參考音量值。例如,對于冷淡的回答,使得參考音量值比針對完全肯定的回答的參考音量值更低,從而可以評價對詢問的回答的冷淡程度。
另外,在重復地輸入詢問的語音與回答的語音并且針對各個回答而計算出評價分數的情況下,可以在圖3的上述步驟sb14、sb15和sb16處將針對各個回答而算出的評價分數相加。
如上詳述的那樣,根據本發明的第一實施例的會話評價裝置10可以通過將對詢問的回答的語音特性與詢問的語音特性進行比較來評價對詢問的回答的語音特性。因此,利用會話評價裝置10,能夠以客觀方式檢驗將被給予至會話參與方的回答的印象。由于作為詢問和回答各自的語音特性的詢問的音高和回答的音高與給會話參與方的印象具有密切關系,因此會話評價裝置10可以通過經由與詢問的音高進行比較而對回答的音高進行評價,來執行對詢問的回答的可靠性高的評價。除了音高之外,作為詢問和回答各自的另一語音特性的從詢問的結束到回答的開始的時間間隔(會話間隔)也與會給予會話參與方的印象具有密切關系。因此,會話評價裝置10可以通過不僅評價詢問和回答的音高而且評價詢問與回答之間的會話間隔來對針對詢問的回答執行甚至更加可靠的評價。
應注意,在會話評價裝置10的第一實施例應用于諸如智能電話或便攜式電話的終端裝置的情況下,終端裝置可以執行語音的輸入和語音特性的獲取,并且可以通過經由網絡與終端裝置連接的外部服務器來執行會話的評價。替選地,終端裝置可以執行語音的輸入,并且外部服務器可以執行語音特性的獲取以及會話的評價。
<第二實施例>
接下來,將描述本發明的第二實施例。圖8是示出了根據本發明的第二實施例的會話評價裝置10的構造的框圖。以上已關于如下這樣一種情況描述了第一實施例:經由單語音輸入部102的麥克風輸入一個人響應于另一人說出的詢問而說出的回答,然后評價所輸入的回答。然而,在第二實施例中,輸入并評價一個人響應于揚聲器134通過話音合成而再現的詢問而說出的回答。應注意,在第二實施例中的具有與會話評價裝置10的第一實施例中元件的功能相似的元件由與第一實施例中的附圖標記相同的附圖標記指示,并且這里將不進行詳細描述以避免不必要的重復。
會話評價裝置10的第二實施例包括詢問選擇部130、詢問再現部132和詢問數據庫124。應注意,在會話評價裝置10的第二實施例中未設置圖1所示的判定部108和語言數據庫122。這是因為在會話評價裝置10的第二實施例中,選擇并且經由揚聲器134可聽地再現具有預定音高的詢問的語音數據(詢問語音數據),因此不需要確定話語是否是詢問。
詢問數據庫125預先存儲了多個詢問語音數據(即,多個詢問的語音數據)。這種詢問語音數據是由模特兒說出的各種語音的記錄。對于例如為wav或mp3格式的每條詢問語音數據,預先確定當以標準方式再現時的每個波形樣本(每個波形周期)的音高以及特定部分(代表性部分)的代表性音高(例如,話語結尾部分的最高音高),并且將指示特定部分的代表性音高的數據與語音數據相關聯地預先存儲在詢問數據庫124中。應注意,“以標準方式再現”是指在與記錄語音數據時的條件相同的條件下(即,在相同音高、相同音量、相同說活速率等下)再現語音數據。
應注意,由多個人a、b、c…中的各個人說出的相同內容的詢問語音可以預先存儲在詢問數據庫124中作為詢問語音數據。例如,這些人a、b、c...可以是名人(知名人士)、天才、歌手等,并且詢問語音數據與這樣的不同的人相關聯地預先存儲在詢問數據庫124中。為了如上所述那樣將詢問語音數據與這樣的不同的人相關聯地預先存儲在詢問數據庫124中,詢問語音數據可以經由存儲介質(比如,存儲卡)預先存儲在詢問數據庫124中,或者替選地,會話評價裝置10可以配備有網絡連接功能,以使得可以將詢問語音數據從特定服務器下載到詢問數據庫124中。另外,可以免費地或付費地從存儲卡或服務器獲取詢問語音數據。
另外,可以做出這樣的配置:用戶可以經由操作輸入部等選擇哪個人應該是詢問語音數據的模特。替選地,可以針對各種不同的條件(日期、周、月等)中的每一個而隨機地確定哪個人應該是詢問語音數據的模特。作為另一替選,經由語音輸入部102的麥克風記錄(或者經由另一裝置轉換成數據)的用戶自身的語音以及用戶的家庭成員和熟人的語音可以預先存儲在數據庫中作為詢問話音數據。因此,當以與用戶關系密切的人的語音說出詢問時,用戶會感覺如同與關系親密的人進行對話一樣。
詢問選擇部130從詢問數據庫124選擇一條詢問語音數據,并且讀出并獲取所選擇的詢問語音數據和與該所選擇的詢問語音數據相關聯的代表性音高數據。詢問選擇部130將所獲取的詢問語音數據提供至詢問再現部132,并且將所獲取的代表性音高數據提供至分析部106。詢問選擇部130可以根據任意期望規則來從多個詢問語音數據當中選擇一個詢問語音數據;例如,詢問選擇部130可以以隨機方式或經由未示出的操作部選擇一條詢問語音數據。詢問再現部132經由揚聲器134可聽地再現從詢問選擇部130提供的詢問語音數據。
接下來,將給出關于會話評價裝置10的第二實施例的操作的描述。圖9是示出在會話評價裝置10的第二實施例中所執行的處理的流程圖。首先,在步驟sc11處,詢問選擇部130從數據庫124中選擇詢問。然后,在步驟sc12處,詢問選擇部130獲取所選詢問的語音數據和特性數據(音高數據)。詢問選擇部130將所獲取的詢問語音數據提供至詢問再現部132,并且將所獲取的音高數據提供至分析部106。然后,分析部106的第一音高獲取部106a獲取從詢問選擇部130提供的代表性音高數據,并且將所獲取的代表性音高數據提供至評價部110。
在緊接著的步驟sc13處,詢問再現部132經由揚聲器134可聽地再現所選擇的詢問語音數據。然后,在步驟sc14處,進行關于詢問的再現是否已結束的判定。如果根據在步驟sc14處的判定確定了詢問的再現已結束,則開始對會話間隔的時間長度進行計時。此后,以與圖2所示的回答說出處理(步驟sa17至sa21)類似的方式,在步驟sc16至sc20中執行回答說出處理。
在會話評價裝置10的該第二實施例中,經由揚聲器134可聽地再現詢問的語音,并且一旦經由語音輸入部102的麥克風輸入對詢問的回答的語音,回答的評價值(分數)就顯示在顯示部112上。由于在該實施例中經由揚聲器134可聽地再現詢問,因此即使在沒有說出詢問的會話參與方的情況下,用戶也可以自己對自己的詢問進行回答。另外,由于經由揚聲器134可聽地再現了詢問,因此,經由語音輸入部102的麥克風僅輸入回答就足矣,這可以消除判定從語音輸入部102輸入的話語是否是詢問的需求。
應注意,分析部106的第一音高獲取部106a可以被構造為:分析在無需話音輸入部102的介入的情況下由詢問選擇部130選擇的詢問語音數據,計算以標準方式再現的詢問語音數據的平均音高,然后向評價部110提供指示作為代表性音高數據的所算出的平均音高的數據。這樣的構造可以消除將代表性音高數據與詢問語音數據相關聯地預先存儲在數據庫124中的需要。
在上述的第二實施例中,語音輸入部102和語音獲取部104一起起到接收回答的語音的聲音信號的接收部的作用,并且詢問選擇部130和第一音高獲取部106a一起起到接收與用于對詢問的語音進行合成的數據相關的語音合成相關數據(上述的存儲的代表性音高數據或所選擇的詢問語音數據)的接收部的作用。
作為第二實施例的變型,與上述實施例相反,可以經由語音輸入部102的麥克風輸入詢問的語音,并且可以經由揚聲器134通過語音合成可聽地再現對詢問的回答的語音。在這樣的情況下,語音輸入部102和語音獲取部104一起起到接收詢問的語音的聲音信號的接收部的作用,并且詢問選擇部130和第二音高獲取部106b一起起到接收與用于對回答的語音進行合成的數據相關的語音合成相關數據(存儲的代表性音高數據或所選擇的回答語音數據)的接收部的作用。
<第三實施例>
接下來,將描述本發明的第三實施例。圖10是示出根據本發明的第三實施例的會話評價裝置10的構造的框圖。以上已經關于經由單語音輸入部102的麥克風輸入兩個人之間的會話的語音的情況來描述了第一實施例。然而,在第三實施例中,經由兩個話音輸入部102a和102b各自的麥克風分別地輸入兩個人之間的會話的語音。應注意,具有與會話評價裝置10的第一實施例中元件的功能類似的功能的第三實施例中的元件由與第一實施例中的附圖標記相同的附圖標記指示,并且這里將不進行詳細描述以避免不必要的重復。
在會話評價裝置10的第三實施例中未設置圖1所示的判定部108和語言數據庫122。由于會話評價裝置10的第三實施例以經由單獨的(僅詢問和僅回答的)語音輸入部102a和102b輸入各個人的語音的這種方式來構造,因而,不需要執行關于話語是否是詢問的特定判定操作,只要說出詢問的人使用僅詢問的語音輸入部102a并且輸說出回答的人使用僅回答的語音輸入部102b即可。在第三實施例中,語音輸入部102a和102b以及語音獲取部104一起起到被配置為單獨地接收詢問的語音的聲音信號和回答的聲音信號的接收部的作用。
接下來,將給出關于會話評價裝置10的第三實施例的操作的描述。圖11是示出在會話評價裝置10的第三實施例中所執行的處理的流程圖,除了圖2的流程圖中的用于判定話語是否是詢問的操作未包括在圖11的流程圖中外,其它部分均類似于圖2的流程圖。另外,圖11所示的步驟sd11、sd12和sd13類似于圖2所示的步驟sa11、sa12和sa15,只不過圖2的步驟sa11、sa12和sa15處出現的詞“話語”被圖11中的詞“詢問”所替代。圖11中所示的步驟sd14至sd19類似于圖2所示的步驟sa16至sa21。
在會話評價裝置10的該第三實施例中,一旦經由語音輸入部102a的麥克風輸入詢問的語音,就經由其它語音輸入部102b的麥克風輸入對詢問的回答的語音。因此,通過分析部106和評價部110對針對所輸入的詢問的語音的所輸入的回答的語音進行評價,并且在顯示部112上顯示所得到的回答的評價值(分數)。由于經由語音輸入部102a和102b各自的麥克風分別地輸入詢問和回答,因此會話評價裝置10的第三實施例可以消除對從語音輸入部102a和102b中的每一個輸入的話語是否是詢問進行判定的需要。