專利名稱:顯示控制裝置及方法
技術領域:
本發明涉及對通過聲音數據(如歌聲數據)擁有的諸如音高和音量的多種屬性進行可視顯示的顯示控制裝置和方法。
背景技術:
迄今已提出了各種卡拉OK裝置,其具有對歌手的歌唱技巧或表現評分的功能。此外,在這樣的卡拉OK裝置中,亦已提以易于歌手掌握或理解的方式來利用代表樂曲旋律的可視圖形形式來顯示樂曲的旋律和歌手的演唱并且允許歌手檢驗其演唱表演的功能。另夕卜,日本專利申請公開第2004-139124號(下文中稱為“相關專利文獻”)中公開了一種技術,用于不僅在五線譜上顯示表示樂曲旋律的音符,還顯示表示每個音符的音量變化和音高變化的圖像或圖形。人聲總會有音高和音量變化。不過根據相關專利文獻中公開的技術,僅可以針對每個音符圖示一條附加信息(即屬性);即無法針對每個音符圖示多個屬性(如音高和音量)。
發明內容
鑒于上述現有技術中的問題,本發明的一個目的是提供一種技術,通過易于用戶掌握屬性的方式顯示通過聲音數據擁有的多個屬性。為了實現上述目的,本發明提供了一種改進的顯示控制裝置,其包括:獲取部分,其配置為獲取表示聲音數據的兩個或更多個屬性的屬性數據;顯示控制部分,其配置為執行控制以顯示由獲取部分獲取的兩個或更多個屬性數據所表示的屬性的值隨時間的變化,其中,在具有表示時間經過的第一軸和與所述第一軸相交的第二軸的坐標平面上,所述顯示控制部分通過沿所述第二軸的坐標位置來顯示所述兩個或更多個屬性中的第一屬性的值,并且顯示第一圖形,在該第一圖形中通過在所述第二軸的方向上延伸的長度來表示所述兩個或更多個屬性中的第二屬性的值。根據以上述方式配置的本發明,能夠以易于用戶掌握屬性的方式顯示聲音數據中包含的多個屬性。在本發明的一個優選實施例中,所述顯示控制部執行控制以與上述坐標位置相關聯地顯示表示第一屬性的值的第二圖形。在本發明的另一個優選實施例中,所述顯示控制部執行控制以通過如下方式顯示第一圖形,其中使得在第一圖形中表示第一屬性的值的坐標位置位于所述第二軸方向上的中心或上端或下端。在本發明的另一個優選實施例中,顯示控制裝置還包括接收部分,其配置為接收表示第一屬性的模型值的模型屬性數據,并且所述顯示控制部執行控制以在所述坐標平面上顯示代表由所述模型屬性數據所表示的模型值的圖形。本發明不僅可以構造和實現為如上面所討論的產品發明,還可以構造和實現為方法發明。此外,本發明可以被配置和實現為由處理器(諸如計算機或DSP)執行的軟件程序,以及被配置和實現為存儲這樣的軟件程序的非臨時性存儲介質。在這種情況下,該程序可以在存儲介質中提供給用戶,然后安裝到用戶的計算機,或從服務器裝置通過通信網絡傳輸到客戶端的計算機,然后安裝到客戶端的計算機中。另外,在本發明中所使用的處理器可以包括具有內置在硬件中的專用邏輯的專用處理器以及能夠運行期望的軟件程序的計算機或其他通用處理器。下面將描述本發明的實施例,但應理解本發明并不限于所描述的實施例,在不脫離基本原理的情況下可以實現本發明的各種變型。因此,本發明的范圍僅由所附的權利要求確定。
下文中將參照附圖僅以示例的方式對本發明的某些優選實施例進行詳細描述,其中:圖1是示出采用本發明實施例的系統的總體構造的示圖;圖2是示出了圖1系統中卡拉OK裝置的硬件結構的框圖;圖3是示出了圖1系統中卡拉OK裝置的功能配置示例的框圖;圖4是示出了圖1系統中卡拉OK裝置的評分部分的功能配置示例的框圖;圖5是示出在該卡拉OK裝置的顯示部分上顯示的屏幕的示例的示圖;圖6是示出了由該卡拉OK裝置的控制部分所執行的示例操作序列的流程圖;圖7是示出在顯示部分上顯示的屏幕示例的示圖;圖8是示出在顯示部分上顯示的另一屏幕示例的示圖;和圖9是表示在顯示部分上顯示的又一屏幕示例的示圖。
具體實施例方式
<實施例的總體構造>圖1是示出采用本發明實施例的系統的構造示圖。該系統包括卡拉OK裝置100、服務器裝置200和網絡NW。該卡拉OK設備100被構造成不僅根據用戶的請求再現卡拉OK樂曲,還評價用戶按照再現的卡拉OK樂曲的演唱。該卡拉OK裝置100是本發明的顯示控制裝置的一個實施例。網絡NW是用于在卡拉OK裝置100和服務器裝置200之間進行數據通信的LAN (局域網)或因特網。服務器裝置200具有內部提供或外部提供的存儲部分,如HDD(硬盤驅動器),其中存儲有諸如與卡拉OK樂曲的內容數據有關的各種數據,并且服務器裝置200構造成根據用戶的請求將內容數據提供給卡拉OK裝置100。在這里,每一個“內容”項包括卡拉OK樂曲的音頻和視頻的組合。即,每項內容數據包括所謂的伴奏數據和視頻數據,伴奏數據表示樂曲旋律中除了歌聲之外的伴奏和合唱,視頻數據表示該樂曲的歌詞和要在歌詞的背景上顯示的視頻。注意,針對一個服務器裝置200可能存在多個卡拉OK裝置100。相反,針對一個卡拉OK裝置100可能存在多個服務器裝置200。注意,本文所用的術語“聲音”是指任何不同類型的聲音,例如人發出的話音和樂器的演奏聲音。圖2是示出了圖1系統中卡拉OK裝置100的硬件結構的框圖。如圖所示,該卡拉OK裝置100包括:控制部分10、存儲部分20、操作部分30、顯示部分40、通信控制部分50、聲音處理部分60、麥克風61和揚聲器62,各部分經由總線70互連。控制部分10包括CPU(中央處理單元)、RAM (隨機存取存儲器)、ROM (只讀存儲器)等。在控制部分10中,CPU通過讀取存儲在ROM或存儲部20中的計算機程序并將讀出的計算機程序加載到RAM來控制卡拉OK裝置100的各部分。操作部分30包括各種操作器,并將指示用戶的各種操作的操作信號輸出到控制部分10。顯示部分40包括例如液晶面板,并且在控制部分10的控制下,顯示部40顯示對應于各卡拉OK樂曲的各種圖像,如歌詞字幕(telop)和背景視頻。通信控制部分50以有線或無線方式將卡拉OK裝置100和網絡匪互連,并且控制卡拉OK裝置100和服務器裝置200之間經過網絡匪進行的數據通信。服務器裝置200是包括CPU和各種存儲器(圖中未示出)的計算機;特別是,服務器裝置200包括網絡存儲器210。網絡存儲器210是例如硬盤驅動器(HDD),其中存儲例如卡拉OK樂曲的內容數據的各種數據。盡管圖2所示的服務器裝置200包括一個網絡存儲器210,但網絡存儲器210的數目并不限于此,服務器裝置200可以包括多個網絡存儲器210。在由用戶預訂的卡拉OK樂曲的內容數據預先存儲在網絡存儲210中的情況下,卡拉OK裝置100在通信控制部分50的控制下與服務器裝置200通信以執行流再現,其中在通過網絡NW下載從網絡存儲器210讀出的內容數據時,卡拉OK裝置100順序地再現內容數據的下載部分。麥克風61將表不所拾取語音的音頻信號輸出到聲音處理部分60。聲音處理部分60包括A/D (模擬數字)轉換器,用于將模擬音頻信號轉換成數字聲音數據,并將數字聲音數據輸出到控制部分10,從而控制部分10接收數字聲音數據。聲音處理部分60還包括D/A (數字模擬)轉換器,用于將從控制部分10接收的數字聲音數據轉換成模擬音頻信號,并將轉換后的模擬音頻信號輸出至揚聲器62,從而揚聲器62基于從聲音處理部分60接收的模擬音頻信號來可聽地輸出聲音。注意,盡管本實施例中是針對麥克風61和揚聲器62包含在卡拉OK裝置100中的情況進行描述,但也可以在聲音處理部分60內僅提供輸入和輸出端子,而不在該卡拉OK裝置100中包括麥克風61和揚聲器62 ;在這種情況下,外部麥克風可以通過音頻電纜連接到聲音處理部分60的輸入端子,而外部揚聲器可以通過音頻電纜連接到聲音處理部分60的輸出端子。另外,盡管在本實施例中針對從麥克風61輸出至揚聲器62的音頻信號是模擬音頻信號的情況進行了描述,但也可以輸出和輸入數字音頻信號。在這種情況下,不需要聲音處理部分60來執行A/D轉換和D/A轉換。類似地,操作部分30和顯示部分40也可以包括各自的外部輸出端子,用于將其連接至外部監視器。存儲部分20是用于在其中存儲各種數據的存儲裝置,例如硬盤驅動器或非易失性存儲器。存儲部分20包括多個存儲區域,如伴奏數據存儲區域21、視頻數據存儲區域22、引導旋律(以下稱作“GM”)數據存儲區域23和用戶歌聲數據存儲區域25。伴奏數據存儲區域21中已預先存儲了與表示各種樂曲的伴奏聲音的伴奏數據有關的信息。每個伴奏數據(如MIDI (樂器數字接口)格式的數據文件)均被賦予了樂曲相關的信息,諸如唯一地識別所關注樂曲的樂曲編號和表示樂曲的名稱的樂曲名稱。視頻數據存儲區域22中預先存儲了表示各種樂曲的歌詞的歌詞數據和表示要在歌詞的背景上顯示的背景視頻的背景視頻數據。在唱卡拉OK時,在顯示部分40上隨著樂曲的進行而將歌詞數據所表示的歌詞顯示為歌詞字幕。在唱卡拉OK時,在顯示部分40上隨著樂曲的進行而將背景視頻數據所表示的背景圖像顯示為歌詞字幕的背景。GM數據存儲區域23中預先存儲了表示樂曲的人聲部分旋律的數據,即作為指定了要演唱的組成音符的數據的引導旋律數據(下文中稱作“GM數據”)。也即,例如以MIDI格式描述的GM數據表示模型聲音音高。這種GM數據被控制部分10用作在評估用戶的演唱技巧或樂曲演奏時的比較標準或基準。由控制部分10執行的評價處理將在后文詳細描述。用戶歌聲數據存儲區域25中存儲了通過聲音處理部分60將在相應伴奏數據的再現期間通過麥克風61拾取的用戶歌聲轉換成數字數據所生成的針對卡拉OK演唱的每個樂曲的聲音數據。在下文中將被稱為“用戶歌聲數據”的這些聲音數據存儲為例如WAVE格式(RIFF波形音頻格式)的數據文件。通過控制部分10將各個樂曲的用戶歌聲數據與樂曲的GM數據相關聯。圖3是示出了卡拉OK裝置100的功能配置示例的框圖。在圖3中,通過控制部分10的CPU讀取預先存儲在ROM或存儲部分20中的計算機程序并將讀出的計算機程序加載到RAM中,來實現再現部分11和評分部分12。再現部分11再現卡拉OK樂曲。具體而言,再現部分11不僅基于伴奏數據和GM數據可聽地通過揚聲器62輸出聲音,還基于視頻數據通過顯示部分40顯示視頻。評分部分12對表示用戶(歌手)的歌聲的聲音數據(用戶歌聲數據)進行評價。即,評分部分12根據歌聲的音高和GM數據的音高之間的差異來評價用戶的演唱表現。圖4是示出了評分部分12的功能配置示例的框圖。在圖4中,分析部分(屬性數據獲取部分)121針對兩個或更多個語音(聲音)屬性分析用戶歌聲數據,并輸出表示所分析的屬性的屬性數據。在本實施例中,將音高和音量用作語音屬性(即,分別為第一和第二屬性)。分析部分(屬性數據獲取部分)121包括音高獲取部分121a和音量獲取部分121b。音高獲取部分121a分析存儲在用戶歌聲數據存儲區域25中的用戶歌聲數據,以檢測歌聲的音高。音高獲取部分121a輸出表示檢測到的音高的數據(下文中稱作“音高數據”)。音量獲取部分121b檢測存儲在用戶歌聲數據存儲區域25中的用戶歌聲數據的音量。音量獲取部分121b輸出表示檢測到的音量的數據(下文中稱作“音量數據”)。比較部分122對通過音高獲取部分121a獲取的用戶歌聲數據的音高與GM數據的音高進行比較,并根據比較的音高之差來對用戶歌聲數據執行評分處理。更具體地,例如,在比較部分122對用戶歌聲數據所表示的語音的音高變化與GM數據所表示的引導旋律的音高變化進行比較,然后計算表示所比較的音高變化之間的一致程度的評價值。例如,對于一個給定的音符,如果音高差落在一個預定的允許范圍之內,則評價值可以被計算為100%(意味著沒有缺點或扣分點),或者如果音高差未落在預定的允許范圍之內的時間段的長度是GM數據中音符的一半聲音長度,則評價值可以被計算為50%。即,通過將音高差落在預定的允許范圍之內的時間段的長度除以GM數據中音符的聲音長度來計算音符的評價值。控制部分10基于所計算的評價值來確定扣分點。例如在對給定的音符預先分配了 “二點”并且評價值計算為50%的情況下,控制部分10確定“I點”作為扣除點。或者,比較部分122也可以考慮通過音量獲取部分121b獲取的用戶歌聲數據的音量來執行評分處理。顯示控制部分123上在顯示部分40上顯示由比較部分122輸出的評分結果。顯示控制部分123不僅用作接收從分析部分121輸出的屬性數據的接收部分,還作為顯示控制部分,用于在顯示部分40上顯示由所接收的屬性數據表示的兩個或更多的語音屬性的值隨著時間的變化(隨時間變化)。以下參照附圖描述由顯示控制部分123執行的顯示控制處理。
圖5是示出了在顯示控制部分123的控制下在顯示部分40上顯示的屏幕的示例的示圖。在圖5的屏幕中,橫軸表示時間的經過,而垂直軸表示音高,該屏幕被構造成在具有表示時間經過的第一軸(水平軸)和與第一軸相交的表示音高的第二軸(垂直軸)的二軸坐標平面上進行與屬性數據有關的顯示。圖中的每個實線300表示一個音符的用戶歌聲數據隨時間的音高變化,并且將在下文稱為“音高曲線300”。S卩,顯示控制部分123利用沿著第二軸(音高軸)的坐標位置指示通過音高獲取部分121a獲取的音高(第一屬性)的值。所指示的音高值的隨時間變化構成了音高曲線300。如將在稍后描述的,音高曲線300作為在顯示部分40上顯示每個時間點的音量值(第二屬性)的基準。在本實施例中,垂直軸(第二軸)用作音高軸和音量軸二者。即,音高(第一屬性)的值由沿垂直軸(第二軸)的絕對值表示,而音量(第二屬性)的值由沿著垂直軸(第二軸)的相對值表示,即由基于與該音量對應的坐標位置的相對值來表示。此外,通過從音高曲線300在每個時間點的坐標位置在垂直軸方向上(B卩,所述第二軸的方向)延伸的長度,顯示控制部分123顯示表示該時間點的音量(第二屬性)的值的音量圖形(第一圖形)500。在這種情況下,按照以音高曲線300在垂直軸方向上的絕對坐標位置作為音量圖形500的中心坐標位置方式,顯示控制部分123通過音高曲線300的相對值的方式顯示音量圖形500。作為示例,以模擬音量幅度波形的正負包絡在幅度中心的正負方向上擺動的方式來顯示音量圖形(第一圖形)500。即,音量圖形500具有相對于音高曲線300豎直對稱的形狀,并且音量圖形500在垂直軸方向上更大的振幅表示更大的音量。注意,在圖5所示的示例中,音高曲線300不僅顯示為基準,還用作可視曲線圖形(第二圖形)以可視地表示音高(第一屬性)的值。另外,在圖5中,每個帶形圖形400表示GM數據(模型屬性數據)的音高,并將在下文中將其稱為“GM圖形400”。GM數據(模型屬性數據)表示音高(第一屬性)的模型值。顯示控制部分123還用作接收GM數據(模型屬性數據)的接收部分。顯示控制部分123在沿垂直和水平軸的位置(坐標)處顯示代表由接收的GM數據表示的GM圖形400。此外,顯示控制部分123在圖5的屏幕上靠近相應的GM圖形400處顯示表示歌詞600的字母圖形(以下稱為“歌詞圖形600”)來作為相關信息。可替換地,顯示控制部分123可以顯示重疊或疊加到GM圖形400中的歌詞圖形600。〈行為〉圖6為示出由控制部分10執行的示例操作序列的流程圖。一旦用戶選擇的樂曲被用戶經由操作部分30預訂(步驟SlOO中的肯定確定),則在步驟S102,控制部分10在存儲部分20中搜索預訂的樂曲。更具體地說,在步驟S102中,使用所選樂曲的樂曲編號或名稱作為搜索關鍵詞,控制部分10在伴奏數據存儲區域21、視頻數據存儲區域22和GM數據存儲區域23中搜索與樂曲相關的數據,并且將通過搜索搜出的數據(搜索出的數據)讀出到RAM 中。然后,在步驟S104中,控制部分10基于上述存儲在RAM中的伴奏數據、視頻數據和GM數據再現卡拉OK樂曲。更具體地說,在步驟S104,控制部分10不僅基于伴奏數據和GM數據通過揚聲器62可聽地再現聲音,還在顯示部40上基于視頻數據顯示視頻。然后,在步驟S106,控制部分10將聲音處理部分60將通過麥克風61拾取的用戶歌聲轉換成數字數據所生成的用戶歌聲數據存儲到用戶歌聲數據存儲區域25中。然后在步驟S108,在完成卡拉OK樂曲的再現后,控制部分10基于存儲在用戶歌聲數據存儲區域25中的用戶歌聲數據和GM數據對用戶的演唱評分。然后在步驟S110,控制部分在顯示部分40上顯示用戶的演唱評分結果。在步驟SllO中,控制部分10在顯示部分40上顯示表示評分結果的字母/字符和圖像,以及圖5所示的歌聲的分析結果。在圖5所示的屏幕上,使用共同的時間軸同時顯示多個屬性(音高和音量),來作為歌聲的分析結果。由于音量是由疊加在音高曲線300上顯示的音量圖形500的顯示寬度來表示的,因此用戶通過用眼跟隨音高曲線300可以很容易地直觀掌握音量和音高二者。<變型例>上述實施例可以如下做出各種修改,并且這些變型例可以按需組合實施。<變型例1>盡管上面已經針對由控制部分10進行分析的聲音屬性為音量和音高的情況描述了優選實施例,不過由控制部分10分析的語音(聲音)的屬性可以是音量和音高之外的任何其它屬性,如清晰發音或清晰度和聲音產生定時(發聲定時),只要該語音屬性可以代表語音的特征或屬性即可。在將語音的清晰度用作要分析的屬性的情況下,例如,控制部分10可以使用FFT (快速傅立葉變換)技術從語音檢測頻譜,并基于電平變化出現共振峰的位置處的電平(即共振峰電平)與電平變化出現低谷的位置處的電平(低谷電平)之間的比例來計算清晰度。更具體地說,控制部分10可以例如執行清晰度計算處理,使得共振峰電平對低谷電平之比越大,則清晰度越高。此外,在將聲音產生定時或發聲定時用作要進行分析的屬性的情況下,控制部分10可以從用戶歌聲數據檢測每個歌詞音素(音符)的發聲定時并顯示一個圖形,在該圖形中,檢測到的發聲定時和模型發聲定時(由GM數據表示)之間的差值越大,則在垂直軸方向上的顯示寬度越大。<變型例2>盡管在本實施例中將控制部分10描述為在顯示部分40上顯示彼此疊加的音高曲線300、GM圖形400和音量圖形500,但本發明并不限于此,控制部分10還可以顯示彼此疊加的音高曲線300和音量圖形500,而不顯示GM圖形400,如圖7所示意性示出的。作為另一種替代方案,控制部分10可以僅顯示音量圖形500而不顯示音高曲線300和GM圖形400。另外,盡管上述實施例中的控制部分10被描述為除了音高曲線300、GM圖形400和音量圖形500,還顯示表示歌詞的歌詞圖形600,如圖5所示,但控制部分10可以構造為不顯示歌詞圖形。<變型例3>在上述實施例中,分析部分121被提供為控制部分10中的屬性數據獲取部分,用于分析用戶歌聲數據來生成表示歌聲屬性的屬性數據,并由此獲取屬性數據。然而,本發明不限于此,控制部分10中的屬性數據獲取部分可以被構造成從經由通信網絡連接的服務器裝置等獲取或接收屬性數據,而不由控制部分10通過用戶歌聲數據分析來生成屬性數據。<變型例4>此外,在上述實施例中,控制部分10構造為相對于音高曲線300垂直對稱的顯示音量圖形500,即音量圖形500具有位于音高曲線300的中心的向上和向下的垂直寬度。然而,音量圖形500的顯示并不限于此,控制部分10可以僅在音高曲線300上方顯示音量圖形500,如圖8所示。在圖8所示的示例中,音量電平由音量圖形500的垂直寬度指示,因此,和上述實施例一樣,音量圖形500中更大的垂直寬度表示更大的音量電平。S卩,控制部分10可以通過使基準屬性的坐標位置位于一個表示其它屬性的圖形的軸向上的中心或上端或者下端的方式,來顯示表示與作為顯示基準的屬性(即,基準屬性(在本實施例中為音高))不同的另一屬性的圖形。作為另一替代方案,音高曲線300和音量圖形500可以如下方式彼此間隔預定距離進行顯示,其中音高曲線300和音量圖形500的顯示位置在垂直軸方向上偏移預定的距離。控制部分10可以被構造為任何期望的方式,只要其通過沿著與表示時間經過的第一軸相交的第二軸的坐標來顯示第一屬性的值,并且通過在第二軸向上從該坐標位置(即上述實施例中音高曲線300的坐標位置)延伸的長度來顯示表示第二屬性的值的圖形。此外,盡管上述實施例已經針對顯示兩種類型的屬性(即音量和音高)的情況進行了描述,但要顯示的屬性的數量并不限于兩個,還可以是兩個以上。例如,如圖9所示,控制部分10可以使用共同的時間軸顯示三種類型的屬性,如音量、音高和清晰度。在圖9示出的圖像中,音高曲線300與上述實施例中的類似,音量圖形500在垂直軸方向上顯示在音高曲線300的上方,并且通過音量圖形500在垂直方向上的寬度來表示音量電平。另外,在圖9中,清晰度圖形700代表語音的清晰度,來作為表示第三屬性的值的第三圖形;清晰度由清晰度圖形700在垂直方向上的寬度來表示。清晰度圖形700在垂直方向上的更大寬度表示更高的清晰度。以音高曲線300作為基準,清晰度圖形700顯示在音高曲線300的下方。此外,在要顯示的屬性的數量是三個或更多的情況下,所述三個或更多個屬性中的任意兩個可以顯示在音高曲線300的上方和下方,并且所述三個或更多個屬性中的另外一個可以在距離該音高曲線預定的距離處進行顯示。此外,盡管上述優選實施例以音高曲線300為基準位置(即基于音高曲線300的位置)顯示音量圖形500,但基準屬性不限于音高,還可以是語音的任何其它適當的屬性。例如,以水平軸表示時間并以垂直軸表示音量的音量曲線可以用作基準位置,并且通過在垂直軸方向上的顯示寬度來表示音高的音高圖形可以與音量曲線重疊地進行顯示。總之,控制部分100只需要在由水平軸表示時間的經過并且由垂直軸表示第一屬性的坐標平面上的位置處顯示基準圖形,并且在與參考圖形的坐標位置對應的位置處顯示由垂直軸方向上的長度來表示第二屬性的值的圖形。此外,上述優選實施例描述為使用通過在垂直軸方向上的長度來表示音量(第二屬性)的值的音量圖形。作為一個變型例,該音量圖形可以由通過顏色(色調、色深等)表示音量(第二屬性)的值的音量圖形來代替。在這種情況下,控制部分10可以如下方式顯示音量圖形500,其中圖形500的顏色隨著音量增大而變深,并且隨著音量降低而變淺。或者,控制部分10可以以這樣的方式顯示音量圖形500,其中隨著音量增大而使圖形500的顏色變得更偏紅(通過在減少其他顏色元素的亮度的同時,增加紅色元素的亮度),并隨著音量降低而變得更偏藍(通過在減少其他顏色元素的亮度的同時增加藍色元素的亮度)。在這種情況下(即與上述實施例中一樣),控制部分10在與音高曲線300的坐標對應的位置處顯示圖形。另外,在這種情況下,各個音量圖形500在形狀和尺寸上可以相同也可以不相同,也就是說,各個音量圖形500之間在形狀和尺寸上可以相同也可以不相同。S卩,在一個變型例中,通過沿垂直軸向的長度來表示音量(第二屬性)的值的顯示音量圖形的方案可以與通過顏色(色調、色深等)表示音量的值的顯示音量圖形的方案組合;也即,可以通過形狀和尺寸變化以及顏色變化的組合來顯示音量圖形。此外,盡管上述優選實施例描述為以水平軸為時間軸并且以垂直軸為音高軸來顯示音高曲線300與音量圖形500,但本發明不限于此,可以任何其它方式設置水平軸和垂直軸,只要控制部分10能夠以一個軸向上的顯示位置表示基準屬性的值并且通過時間軸表示時間經過來顯示圖形即可。<變型例5>在上述優選實施例中,控制部分10構造為將用戶歌聲數據存儲到用戶歌聲數據存儲區域25中,并且在用戶演唱終止時執行分析結果顯示處理。然而,本發明并不限于此,控制部分10可以在用戶演唱期間實時執行分析結果顯示處理。另外,在上述優選實施例中,控制部分10不僅構造為再現卡拉OK樂曲和記錄用戶的歌聲,還可以構造為在卡拉OK樂曲的再現終止時分析用戶歌聲數據來顯示所分析的結果(即,用戶歌聲數據分析的結果)。然而,本發明不限于此,控制部分10可以被構造來對先前記錄的用戶歌聲數據(即,預先存儲在存儲部分20中的語音數據)執行分析結果顯示處理,然后執行分析結果顯示處理。此外,盡管上述優選實施例中的控制部分10被構造用來比較歌聲的音高和GM數據的音高,并基于比較結果執行評價處理,但該評價處理還可以任何其他期望的方式執行。例如,控制部分10可以針對給定的評價項利用任何常規已知的方案(如使用FFT等的頻率分析或音量分析)計算出評價值(即評價結果)。此外,盡管在上述實施例中將控制部分10構造為對用戶(歌手)的歌聲進行分析,但控制部分10還可以分析和評價由用戶演奏樂器所產生的演奏聲音,而不是用戶的歌聲。即,如上所述,本文所用的術語“聲音”是指任何類型的聲音,例如人發出的語音以及通過樂器產生的演奏聲音。〈變型例6>作為另一變型例,經由通信網絡相互連接的兩個或多個裝置可以共享本發明的優選實施例的卡拉OK裝置100的功能,因此包括這些裝置的系統可以實現該卡拉OK裝置100。例如,包括麥克風、揚聲器、顯示裝置、操作部分等的計算機裝置以及執行聲音分析處理的服務器裝置可以經由通信網絡相互連接構成一個系統。在這種情況下,計算機裝置可將通過麥克風拾取的每個聲音轉換成音頻信號,并將該音頻信號發送到服務器裝置,服務器裝置可以分析所接收到的音頻信號并將分析結果發送到計算機裝置。<變型例7>此外,盡管上述實施例已經描述了將本發明的顯示控制裝置應用到不僅再現卡拉OK伴奏也對歌聲評分的卡拉OK裝置的情況,但本發明的顯示控制裝置還可以應用到卡拉OK裝置以外的任何其他裝置,只要該其他裝置是對聲音數據進行分析并對聲音數據的分析結果進行顯示的裝置即可。即,本發明的顯示控制裝置可以適用于各種類型的裝置,如顯示聲音分析結果的裝置、進行聲音合成和編輯的裝置、以及具有支持語言學習功能的裝置。在本發明的顯示控制裝置被應用到聲音編輯裝置中的情況下,例如通過使用共同的時間軸同時顯示多個聲音屬性,用戶可以直觀地掌握多個聲音屬性,因此便于聲音合成和編輯。
此外,盡管上述實施例已經描述了使用GM數據作為表示模型聲音屬性的模型屬性數據,但GM數據以外的其他數據也可以用作模型屬性數據。例如,在將本發明的顯示控制裝置應用到聲音編輯裝置的情況下,可以通過將分析結果舍入到12音階所獲得的數據用作模型屬性數據。在這種情況下,與上述優選實施例相似,控制部分10顯示表示所分析的屬性的圖形以及表示模型屬性數據的圖形,如圖5所示。簡言之,模型屬性數據可以是任意數據,只要它表示模型聲音的屬性即可。<變型例8>本發明可以不僅實現為顯示控制裝置,還可以作為實現這樣的顯示控制裝置的方法和用于使計算機實現顯示控制功能的程序。該程序可以被提供在其中存儲程序的存儲介質(如光盤)中,或者可以通過互聯網等被下載和安裝到計算機來提供。
權利要求
1.一種顯示控制裝置,包括: 獲取部分,其配置為獲取表示聲音數據的兩個或更多個屬性的屬性數據; 顯示控制部分,其配置為執行控制,以在顯示部分上顯示通過所述獲取部分獲取的屬性數據所表示的兩個或更多個屬性的值隨時間的變化,其中在具有表示時間經過的第一軸和與所述第一軸相交的第二軸的坐標平面上,所述顯示控制部分通過沿所述第二軸的坐標位置來顯示所述兩個或更多個屬性中的第一屬性的值,并且顯示第一圖形,在該第一圖形中通過在所述第二軸的方向上延伸的長度來表示所述兩個或更多個屬性中的第二屬性的值。
2.如權利要求1所述的顯示控制裝置,其中所述顯示控制部分執行控制以與所述坐標位置相關聯地顯示表示第一屬性的值的第二圖形。
3.如權利要求1或2 所述的顯示控制裝置,其中所述顯示控制部分執行控制以通過如下方式顯示所述第一圖形,其中使得在所述第一圖形中表示第一屬性的值的坐標位置位于所述第二軸方向上的中心或上端或下端。
4.如權利要求1或2所述的顯示控制裝置,還包括接收部分,其配置為接收表示所述第一屬性的模型值的模型屬性數據,并且 其中所述顯示控制部分執行控制以在所述坐標平面上顯示代表由所述模型屬性數據所表示的模型值的圖形。
5.如權利要求4所述的顯示控制裝置,其中所述顯示控制部分還執行控制以在代表由所述模型屬性數據所表示的模型值的圖形附近顯示相關信息。
6.如權利要求1或2所述的顯示控制裝置,其中所述顯示控制部分執行控制以使得表示所述第一屬性的值的坐標位置和所述第二圖形的顯示位置在所述第二軸的方向上彼此偏移預定的距離。
7.如權利要求1或2所述的顯示控制裝置,其中所述顯示控制部分執行控制以使得表示所述第一屬性的值的坐標位置在所述第二軸的方向上顯示在所述第一圖形的上方或下方,或者疊加在所述第一圖形上。
8.如權利要求7所述的顯示控制裝置,其中所述顯示控制部分執行控制以使得表示所述第一屬性的值的坐標位置和所述第二圖形的顯示位置在所述第二軸的方向上彼此偏移預定的距離。
9.如權利要求1或2所述的顯示控制裝置,其中所述顯示控制部分執行控制以與表示所述第一屬性的值的坐標位置相關聯地顯示第三圖形,所述第三圖形表示所述兩個或更多個屬性中的第三屬性。
10.如權利要求9所述的顯示控制裝置,其中所述顯示控制部分執行控制以使得表示所述第一屬性的值的坐標位置在所述第二軸的方向上顯示在所述第三圖形的上方或下方。
11.如權利要求10所述的顯示控制裝置,其中所述顯示控制部分執行控制以使得表示所述第一屬性的值的坐標位置和所述第三圖形的顯示位置在所述第二軸的方向上彼此偏移預定的距離。
12.如權利要求1或2所述的顯示控制裝置,其中所述顯示控制部分執行控制以使得根據所述第二屬性的值來改變所述第一圖形的顏色。
13.—種計算機實現的方法,包括:獲取步驟,其中獲取表示聲音數據的兩個或更多個屬性的屬性數據; 執行控制的步驟,其中執行控制以在顯示部分上顯示通過所述獲取步驟獲取的屬性數據所表示的兩個或更多個屬性的值隨時間的變化,其中在具有表示時間經過的第一軸和與所述第一軸相交的第二軸的坐標平面上,通過沿所述第二軸的坐標位置來顯示所述兩個或更多個屬性中的第一屬性的值,并且顯示第一圖形,在該第一圖形中通過在所述第二軸的方向上延伸的長度來表示所述兩個或 更多個屬性中的第二屬性的值。
全文摘要
本發明為顯示控制裝置及方法,控制部分(10)對聲音數據進行分析以獲取表示多個屬性(如音高和音量)的數據,并在顯示屏幕(40)上顯示表示所獲取的音高和音量的圖形。此時,控制部分(10)在顯示屏幕上顯示音高曲線,其中音高的值由垂直軸代表,而時間的經過由水平軸代表。此外,顯示控制部分還基于音高曲線的顯示位置在顯示屏幕上的特定位置處顯示音量圖形,其中音量電平由音量圖形在垂直軸方向上的長度或距離或寬度來代表。
文檔編號G10L21/06GK103187046SQ20121058010
公開日2013年7月3日 申請日期2012年12月27日 優先權日2011年12月27日
發明者大島治, 永田資司 申請人:雅馬哈株式會社