本文涉及但不限于音頻技術,尤指一種實現音頻處理的方法及裝置。
背景技術:
音頻文件是日常生活中比較常見的文件,人們通過音頻文件記錄信息、文藝欣賞、知識講解、娛樂活動等;其中,在工作環境中,例如、多參與者發言的會議(包括、辯論)場合,為了防止要點遺漏、以及方便后期對會議的內容進行回顧,一般需要對會議內容進行音頻錄制;在娛樂環境中,例如、以組合形式參與的音樂競賽,一個組合中的多個參賽者為了掌握自身技能的不足,在練習時,一般會對排練過程進行音頻錄制;一份知識講解的音頻文件中,不同參與者根據自身學識發表不同的見解;另外,日常生活中還存在包含多參與者的音頻文件,音頻文件中不同參與者表達各自對同一主題的不同見解。
目前,如果是會議錄制的音頻文件,一般將一個時間段的會議內容存儲為一個音頻文件;例如、每一次會間休息時,將會間休息之前的會議內容錄制為一份音頻文件;如果是音樂競賽錄制的音頻文件,一般將一次排練的過程錄制為一份音頻文件;如果是根據主題錄制好的音頻文件,則一般根據主題的定義及時長,生成一個或一個以上音頻文件。
一份音頻文件中包含多個參與者的音頻信息,如果需要獲得其中一個參與者的音頻信息時,需要聽取整份音頻文件,如果一個參與者參與的內容存在于多份音頻文件,則需要將多份音頻文件都聽一遍,費時且效率低。
技術實現要素:
以下是對本文詳細描述的主題的概述。本概述并非是為了限制權利要求的保護范圍。
本發明實施例提供一種實現音頻處理的方法及裝置,能夠提高對音頻文件的查看效率。
本發明實施例提供了一種實現音頻處理的裝置,包括:區分單元和存儲單元;其中,
所述區分單元用于,獲取音頻文件中的區分信息,根據區分信息區分音頻文件中不同參與者的音頻信息;
所述存儲單元用于,將區分出的不同參與者的音頻信息,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件。
可選的,所述區分信息包括:硬件區分標識、聲紋特征、音頻信息的輸入方向;
所述區分單元具體用于:
所述區分信息包括硬件區分標識時,預先設置每一個用于輸入所述音頻信息的硬件相對應的硬件區分標識,并在所述音頻文件中添加所述硬件區分標識;根據所述硬件區分標識區分音頻文件中每一個參與者輸入的所述音頻信息;
所述區分信息包括聲紋特征時,提取所述音頻文件中音頻信息的聲紋特征,將提取的聲紋特征與預先存儲的每一個參與者的聲紋特征進行匹配;根據聲紋特征的匹配結果區分每一個參與者的音頻信息;
所述區分信息包括音頻信息的輸入方向時,確定所述音頻文件包含的所述音頻信息的輸入方向;根據輸入方向的不同區分每一個參與者輸入的音頻信息。
可選的,所述存儲單元具體用于:
將區分的每一個參與者的音頻信息添加區分標記信息后,分別存儲為包含區分標記信息的對應于參與者的參與者音頻文件;
所述區分標記信息包括以下任意信息的組合:區分名稱、區分編碼。
可選的,所述存儲單元還用于:
將從所述音頻文件中區分并存儲的對應于參與者的參與者音頻文件分別存儲在對應的預設文件夾中;或,
將從所述音頻文件中區分并存儲的對應于參與者的參與者音頻文件通過預設的區分目錄進行存儲。
可選的,所述裝置還包括添加單元,用于在區分的每一個參與者的音頻信息中添加時間信息。
另一方面,本發明實施例還提供一種實現音頻處理的方法,包括:
獲取音頻文件中的區分信息,根據區分信息區分音頻文件中不同參與者的音頻信息;
將區分出的不同參與者的音頻信息,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件。
可選的,所述區分信息包括:硬件區分標識、聲紋特征、音頻信息的輸入方向;
所述區分信息包括硬件區分標識時,所述區分不同參與者的音頻信息包括:
預先設置每一個用于輸入所述音頻信息的硬件相對應的硬件區分標識,并在所述音頻文件中添加所述硬件區分標識,根據所述硬件區分標識區分音頻文件中每一個參與者輸入的所述音頻信息;
所述區分信息包括聲紋特征時,所述區分不同參與者的音頻信息包括:
提取所述音頻文件中音頻信息的聲紋特征,將提取的聲紋特征與預先存儲的每一個參與者的聲紋特征進行匹配,根據聲紋特征的匹配結果區分每一個參與者的音頻信息;
所述區分信息包括音頻信息的輸入方向時,所述區分不同參與者的音頻信息包括:
確定所述音頻文件包含的所述音頻信息的輸入方向,根據輸入方向的不同區分每一個參與者輸入的音頻信息。
可選的,所述按照參與者的不同分別存儲為對應于參與者的參與者音頻文件包括:
將區分的每一個參與者的音頻信息添加區分標記信息后,分別存儲為包含區分標記信息的對應于參與者的參與者音頻文件;
所述區分標記信息包括以下任意信息的組合:區分名稱、區分編碼。
可選的,所述方法還包括:
將從所述音頻文件中區分并存儲的對應于參與者的參與者音頻文件分別存儲在對應的預設文件夾中;或,
將從所述音頻文件中區分并存儲的對應于參與者的參與者音頻文件通過預設的區分目錄進行存儲。
可選的,所述方法還包括:在區分的每一個參與者的音頻信息中添加時間信息。
與相關技術相比,本申請技術方案包括:獲取音頻文件中的區分信息,根據區分信息區分音頻文件中不同參與者的音頻信息;將區分出的不同參與者的音頻信息,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件。本發明實施例,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的音頻信息進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,節省了查看音頻文件的時間,提高了對音頻文件的查看效率。在閱讀并理解了附圖和詳細描述后,可以明白其他方面。
附圖說明
圖1為實現本發明各個實施例的移動終端的硬件結構示意圖;
圖2為本發明實施例實現音頻處理的方法的流程圖;
圖3為本發明實施例基于硬件區分標識區分音頻信息的場景示意圖;
圖4為本發明實施例音頻信息輸入方向示意圖;
圖5為本發明實施例采用預設文件夾存儲參與者音頻文件的示意圖;
圖6為本發明實施例采用區分目錄存儲參與者音頻文件的示意圖;
圖7為本發明另一實施例實現音頻處理的方法的流程圖;
圖8為本發明實施例實現音頻處理的裝置的結構框圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚明白,下文中將結合附圖對本發明的實施例進行詳細說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。
現在將參考附圖描述實現本發明各個實施例的移動終端。在后續的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發明的說明,其本身并沒有特定的意義。因此,"模塊"與"部件"可以混合地使用。
移動終端可以以各種形式來實施。例如,本發明中描述的終端可以包括諸如移動電話、智能電話、筆記本電腦、數字廣播接收器、PDA(個人數字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導航裝置等等的移動終端以及諸如數字TV、臺式計算機等等的固定終端。下面,假設終端是移動終端。然而,本領域技術人員將理解的是,除了特別用于移動目的的元件之外,根據本發明的實施方式的構造也能夠應用于固定類型的終端。
圖1為實現本發明各個實施例的移動終端的硬件結構示意。
移動終端100可以包括A/V(音頻/視頻)輸入單元120、用戶輸入單元130、輸出單元150、存儲器160、控制器180和電源單元190等等。圖1示出了具有各種組件的移動終端,但是應理解的是,并不要求實施所有示出的組件。可以替代地實施更多或更少的組件。將在下面詳細描述移動終端的元件。
A/V輸入單元120用于接收音頻或視頻信號。A/V輸入單元120可以包括麥克風122,麥克風122可以在電話通話模式、記錄模式、語音識別模式等等運行模式中經由麥克風接收聲音(音頻數據),并且能夠將這樣的聲音處理為音頻數據。麥克風122可以實施各種類型的噪聲消除(或抑制)算法以消除(或抑制)在接收和發送音頻信號的過程中產生的噪聲或者干擾。
用戶輸入單元130可以根據用戶輸入的命令生成鍵輸入數據以控制移動終端的各種操作。用戶輸入單元130允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋仔片、觸摸板(例如,檢測由于被接觸而導致的電阻、壓力、電容等等的變化的觸敏組件)、滾輪、搖桿等等。特別地,當觸摸板以層的形式疊加在顯示單元151上時,可以形成觸摸屏。
輸出單元150被構造為以視覺、音頻和/或觸覺方式提供輸出信號(例如,音頻信號、視頻信號、警報信號、振動信號等等)。輸出單元150可以包括顯示單元151、音頻輸出模塊152等。
顯示單元151可以顯示在移動終端100中處理的信息。例如,當移動終端100處于電話通話模式時,顯示單元151可以顯示與通話或其它通信(例如,文本消息收發、多媒體文件下載等等)相關的用戶界面(UI)或圖形用戶界面(GUI)。當移動終端100處于視頻通話模式或者圖像捕獲模式時,顯示單元151可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關功能的UI或GUI等等。
同時,當顯示單元151和觸摸板以層的形式彼此疊加以形成觸摸屏時,顯示單元151可以用作輸入裝置和輸出裝置。顯示單元151可以包括液晶顯示器(LCD)、薄膜晶體管LCD(TFT-LCD)、有機發光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等等中的至少一種。這些顯示器中的一些可以被構造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機發光二極管)顯示器等等。根據特定想要的實施方式,移動終端100可以包括兩個或更多顯示單元(或其它顯示裝置),例如,移動終端可以包括外部顯示單元(未示出)和內部顯示單元(未示出)。觸摸屏可用于檢測觸摸輸入壓力以及觸摸輸入位置和觸摸輸入面積。
音頻輸出模塊152可以在移動終端處于呼叫信號接收模式、通話模式、記錄模式、語音識別模式、廣播接收模式等等模式下時,將無線通信單元110接收的或者在存儲器160中存儲的音頻數據轉換音頻信號并且輸出為聲音。而且,音頻輸出模塊152可以提供與移動終端100執行的特定功能相關的音頻輸出(例如,呼叫信號接收聲音、消息接收聲音等等)。音頻輸出模塊152可以包括揚聲器、蜂鳴器等等。
存儲器160可以存儲由控制器180執行的處理和控制操作的軟件程序等等,或者可以暫時地存儲己經輸出或將要輸出的數據(例如,電話簿、消息、靜態圖像、視頻等等)。而且,存儲器160可以存儲關于當觸摸施加到觸摸屏時輸出的各種方式的振動和音頻信號的數據。
存儲器160可以包括至少一種類型的存儲介質,所述存儲介質包括閃存、硬盤、多媒體卡、卡型存儲器(例如,SD或DX存儲器等等)、隨機訪問存儲器(RAM)、靜態隨機訪問存儲器(SRAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、可編程只讀存儲器(PROM)、磁性存儲器、磁盤、光盤等等。而且,移動終端100可以與通過網絡連接執行存儲器160的存儲功能的網絡存儲裝置協作。
控制器180通??刂埔苿咏K端的總體操作。例如,控制器180執行與語音通話、數據通信、視頻通話等等相關的控制和處理。另外,控制器180可以包括用于再現(或回放)多媒體數據的多媒體模塊181,多媒體模塊181可以構造在控制器180內,或者可以構造為與控制器180分離??刂破?80可以執行模式識別處理,以將在觸摸屏上執行的手寫輸入或者圖片繪制輸入識別為字符或圖像。
電源單元190在控制器180的控制下接收外部電力或內部電力并且提供操作各元件和組件所需的適當的電力。
這里描述的各種實施方式可以以使用例如計算機軟件、硬件或其任何組合的計算機可讀介質來實施。對于硬件實施,這里描述的實施方式可以通過使用特定用途集成電路(ASIC)、數字信號處理器(DSP)、數字信號處理裝置(DSPD)、可編程邏輯裝置(PLD)、現場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設計為執行這里描述的功能的電子單元中的至少一種來實施,在一些情況下,這樣的實施方式可以在控制器180中實施。對于軟件實施,諸如過程或功能的實施方式可以與允許執行至少一種功能或操作的單獨的軟件模塊來實施。軟件代碼可以由以任何適當的編程語言編寫的軟件應用程序(或程序)來實施,軟件代碼可以存儲在存儲器160中并且由控制器180執行。
至此,己經按照其功能描述了移動終端。下面,為了簡要起見,將描述諸如折疊型、直板型、擺動型、滑動型移動終端等等的各種類型的移動終端中的滑動型移動終端作為示例。因此,本發明能夠應用于任何類型的移動終端,并且不限于滑動型移動終端。
基于上述移動終端硬件結構提出本發明方法各個實施例。
圖2為本發明實施例實現音頻處理的方法的流程圖,如圖2所示,本發明實施例可以包括:
步驟200、獲取音頻文件中的區分信息,根據區分信息區分音頻文件中不同參與者的音頻信息;
可選的,本發明實施例區分信息可以包括:硬件區分標識、聲紋特征、音頻信息的輸入方向;
可選的,本發明實施例區分不同參與者的音頻信息的方法可以是以下任意一種方法:
方法一:預先設置每一個用于輸入音頻信息的硬件相對應的硬件區分標識,并在音頻文件中添加硬件區分標識,根據硬件區分標識區分音頻文件中每一個參與者輸入的音頻信息;
需要說明的是,如果輸入音頻信息的硬件本身具備相對應的物理標識,則可以直接將硬件本身具備的物理標識作為本發明實施例的硬件區分標識。在音頻信息中添加硬件區分標識時,本發明實施例陳述的音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過讀取音頻文件中的硬件區分標識可以區分不同參與者的音頻信息;圖3為本發明實施例基于硬件區分標識區分音頻信息的場景示意圖,如圖3所示,參與者1到參與者5分別擁有用于發言的麥克(用于輸入音頻信息的硬件),以參與者1為例,參與者1發言時,通過麥克1輸入音頻信息,錄制音頻文件時,在麥克1輸入的音頻信息中添加麥克1的硬件區分標識。方法一可以適用于不同參與者分別使用獨立的麥克的會議或辯論場景,參與者通過麥克發言時,可以直接在音頻信息中添加硬件區分標識,直接區分不同參與者輸入的音頻信息。
方法二:提取音頻文件中音頻信息的聲紋特征,將提取的聲紋特征與預先存儲的每一個參與者的聲紋特征進行匹配,根據聲紋特征的匹配結果區分每一個參與者的音頻信息;
需要說的是,通過提取聲紋特征識別上述音頻文件中每一個參與者的音頻信息時,本發明實施例音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過提取的音頻文件中包含的音頻信息的聲紋特征,將提取的聲紋特征和預先存儲的每一個參與者的聲紋特征進行匹配,可以區分音頻文件中每一個參與者的音頻信息;
方法三:確定音頻文件包含的音頻信息的輸入方向,根據輸入方向的不同區分每一個參與者輸入的音頻信息。
需要說的是,本發明實施例通過音頻信息的輸入方向確定每一個參與者的音頻信息時,音頻文件可以是正在錄制的音頻文件,音頻信息的輸入方向可以通過預先設置的傳感器進行區分;圖4為本發明實施例音頻信息輸入方向示意圖,如圖4所示,設置標準坐標后,設定每隔90度為一個方向后,參會的4個參與者,根據參與者所處位置的不同區分每一個參與者的音頻信息;這里,90度只是一個示例角度,根據參與者人數的多少,確定方向的角度可以進行調整,例如、6個參會參與者時,以60度作為每一個方向的角度。
本發明實施例采用上述三種方法中的一種方法區分不同參與者的音頻信息后,分割音頻文件中不同參與者的音頻信息并存儲為對應于參與者的參與者音頻文件可以采用相關技術中的音頻處理方法實現。
本發明實施例可以以手機、平板、電腦、錄音機等設備作為硬件執行主體。
步驟201、將區分出的不同參與者的音頻信息,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件。
需要說明的是,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,提高了對音頻文件的查看效率。以會議錄制的音頻文件為例,假設會議上有5名參會成員發言,且會議進行過程中5名參會人員進行了多輪的意見發表,假設會議結束后,參會人員覺得參會成員A在會議發言的內容對會議要討論的項目具有積極的意義,因此建議查看參會成員A的發言的內容;如果按照相關技術的處理方法,需要從頭到尾的播放錄制的音頻文件;如果需要多次查看,或者會議包含多個階段,則查看參會成員A的發言的內容過程十分繁瑣,效率低;采用本發明實施例,由于將各參會成員的音頻信息區分并存儲為對應于參與者的參與者音頻文件;查看參與成員A的會議發言時,只需要針對存儲的對應于參會成員A的參與者音頻文件即可,提高了音頻信息的查看效率。
可選的,本發明實施例,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件包括:
將區分的每一個參與者的音頻信息添加區分標記信息后,分別存儲為包含區分標記信息的對應于參與者的參與者音頻文件;
區分標記信息可以包括以下任意信息的組合:區分名稱、區分編碼。
需要說明的是,本發明實施例區分標記信息可以僅包含區分名稱,或僅包含區分編碼;區分名稱可以是參與者的賬戶名、參與者的席位名等;區分編碼可以是新建的排序編碼、員工編號、及其他可以區分不同參與者的編碼。
可選的,本發明實施例方法還包括:
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件分別存儲在對應的預設文件夾中;或,
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件通過預設的區分目錄進行存儲。
需要說的是,本發明實施例可以在區分不同參與者的參與者音頻文件后,分別存儲在對應的預設文件夾中;圖5為本發明實施例采用預設文件夾存儲參與者音頻文件的示意圖,如圖5所示,假設會議的音頻文件經過本發明實施例區分音頻信息后,確認包含張三、李四、趙五的參與者音頻文件,則可以分別設置張三、李四、趙五的文件夾,并將每一個文件夾路徑作為每一個參與者的參與者音頻文件的存儲路徑,分別存儲張三、李四、趙五的參與者音頻文件。
本發明實施例也可以采用區分目錄的方式對不同參與者的參與者音頻文件進行存儲,依舊以張三、李四、趙五的參與者音頻文件為例,圖6為本發明實施例采用區分目錄存儲參與者音頻文件的示意圖,如圖6所示,通過目錄名稱將張三、李四、趙五的參與者音頻文件進行了區分,通過區分目錄可以高效的查找指定參與者的參與者音頻文件;本發明實施例一個參與者包含多個參與者音頻文件時,可以按照時間先后順序進行排序存儲,相應的,可以將排序存儲的同一個參與者的多個參與者音頻文件進行編號排序;例如、從音頻文件中區分出三段張三的音頻信息,將三段張三的音頻信息存儲為三個對應于張三的參與者音頻文件,則可以存儲為張三音頻文件1、張三音頻文件2和張三音頻文件3。
可選的,本發明實施例方法還可以包括:在區分的每一個參與者的音頻信息中添加時間信息。
需要說明的是,本發明實施例時間信息可以是時間戳信息,也可以是排序先后的信息,對于同一個參與者不同時間段的音頻信息,可以分別存儲為對應于參與者的參與者音頻文件,同一參與者的不同時間段的參與者音頻文件可以通過時間戳信息或排序先后信息進行區分。在音頻信息中添加的是時間戳信息時,可以根據錄制音頻文件的時間以及音頻信息所處時間段進行確定。
本發明實施例,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應特定參與者的參與者音頻文件進行查看即可,節省了查看音頻文件的時間,提高了對音頻文件的查看效率。
圖7為本發明實施例實現音頻處理的方法的流程圖,如圖7所示,本發明實施例可以包括:
步驟700、獲取音頻文件中的區分信息,根據區分信息區分音頻文件中不同參與者的音頻信息;
可選的,本發明實施例區分信息可以包括:硬件區分標識、聲紋特征、音頻信息的輸入方向;
可選的,本發明實施例區分不同參與者的音頻信息的方法可以是以下任意一種方法:
方法一:預先設置每一個用于輸入音頻信息的硬件相對應的硬件區分標識,并在音頻文件中添加硬件區分標識,根據硬件區分標識區分音頻文件中每一個參與者輸入的音頻信息;
需要說明的是,如果輸入音頻信息的硬件本身具備相對應的物理標識,則可以直接將硬件本身具備的物理標識作為本發明實施例的硬件區分標識。在音頻信息中添加硬件區分標識時,本發明實施例陳述的音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過讀取音頻文件中的硬件區分標識可以區分不同參與者的音頻信息;方法一可以適用于不同參與者分別使用獨立的麥克的會議或辯論場景,參與者通過麥克發言時,可以直接在音頻信息中添加硬件區分標識,直接區分不同參與者輸入的音頻信息。
方法二:提取音頻文件中音頻信息的聲紋特征,將提取的聲紋特征與預先存儲的每一個參與者的聲紋特征進行匹配,根據聲紋特征的匹配結果區分每一個參與者的音頻信息;
需要說的是,通過提取聲紋特征識別上述音頻文件中每一個參與者的音頻信息時,本發明實施例音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過提取的音頻文件中包含的音頻信息的聲紋特征,將提取的聲紋特征和預先存儲的每一個參與者的聲紋特征進行匹配,可以區分音頻文件中每一個參與者的音頻信息;
方法三:確定音頻文件包含的音頻信息的輸入方向,根據輸入方向的不同區分每一個參與者輸入的音頻信息。
需要說的是,本發明實施例通過音頻信息的輸入方向確定每一個參與者的音頻信息時,音頻文件可以是正在錄制的音頻文件,音頻信息的輸入方向可以通過預先設置的傳感器進行區分;例如、設置標準坐標后,設定每隔一個預設角度為一個方向,根據預設角度設定方向后,根據參與者所處位置的不同區分不同參與者的音頻信息。
本發明實施例采用上述三種方法中的一種方法區分不同參與者的音頻信息后,分割音頻文件中不同參與者的音頻信息并存儲為對應于參與者的參與者音頻文件可以采用相關技術中的音頻處理方法實現。
本發明實施例可以以手機、平板、電腦、錄音機等設備作為硬件執行主體。
步驟701、在區分的每一個參與者的音頻信息中添加時間信息。
需要說明的是,本發明實施例時間信息可以是時間戳信息,也可以是排序先后的信息,對于同一個參與者不同時間段的音頻信息,可以分別存儲為對應于參與者的參與者音頻文件,同一參與者的不同時間段的參與者音頻文件可以通過時間戳信息或排序先后信息進行區分。在音頻信息中添加的是時間戳信息時,可以根據錄制音頻文件的時間以及音頻信息所處時間段進行確定。
步驟702、將區分出的不同參與者的音頻信息,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件。這里的音頻信息包括步驟701中添加了時間信息的音頻信息。
需要說明的是,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,提高了對音頻文件的查看效率。以會議錄制的音頻文件為例,假設會議上有5名參會成員發言,且會議進行過程中5名參會人員進行了多輪的意見發表,假設會議結束后,參會人員覺得參會成員A在會議發言的內容對會議要討論的項目具有積極的意義,因此建議查看參會成員A的發言的內容;如果按照相關技術的處理方法,需要從頭到尾的播放錄制的音頻文件;如果需要多次查看,或者會議包含多個階段,則查看參會成員A的發言的內容過程十分繁瑣,效率低;采用本發明實施例,由于將各參會成員的音頻信息區分并存儲為對應于參與者的參與者音頻文件;查看參與成員A的會議發言時,只需要針對存儲的對應于參會成員A的參與者音頻文件即可,提高了音頻信息的查看效率。
可選的,本發明實施例,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件包括:
將區分的每一個參與者的音頻信息添加區分標記信息后,分別存儲為包含區分標記信息的對應于參與者的參與者音頻文件;
區分標記信息可以包括以下任意信息的組合:區分名稱、區分編碼。
需要說明的是,本發明實施例區分標記信息可以僅包含區分名稱,或僅包含區分編碼;區分名稱可以是參與者的賬戶名、參與者的席位名等;區分編碼可以是新建的排序編碼、員工編號、及其他可以區分不同參與者的編碼。
可選的,本發明實施例方法還包括:
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件分別存儲在對應的預設文件夾中;或,
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件通過預設的區分目錄進行存儲。
需要說的是,本發明實施例可以在區分不同參與者的參與者音頻文件后,分別存儲在對應的預設文件夾中;假設會議的音頻文件經過本發明實施例區分音頻信息后,確認包含張三、李四、趙五的參與者音頻文件,則可以分別設置張三、李四、趙五的文件夾,并將每一個文件夾路徑作為每一個參與者的參與者音頻文件的存儲路徑,分別存儲張三、李四、趙五的參與者音頻文件。
本發明實施例也可以采用區分目錄的方式對不同參與者的參與者音頻文件進行存儲,依舊以張三、李四、趙五的參與者音頻文件為例,通過目錄名稱將張三、李四、趙五的參與者音頻文件進行了區分,通過區分目錄可以高效的查找指定參與者的參與者音頻文件;本發明實施例一個參與者包含多個參與者音頻文件時,可以按照時間先后順序進行排序存儲,相應的,可以將排序存儲的同一個參與者的多個參與者音頻文件進行編號排序;例如、從音頻文件中區分出三段張三的音頻信息,將三段張三的音頻信息存儲為三個對應于張三的參與者音頻文件,則可以存儲為張三音頻文件1、張三音頻文件2和張三音頻文件3。
本發明實施例,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,節省了查看音頻文件的時間,提高了對音頻文件的查看效率。
圖8為本發明實施例實現音頻處理的裝置的結構框圖,如圖8所示,包括:區分單元和存儲單元;其中,
區分單元用于,獲取音頻文件中的區分信息,根據區分信息區分音頻文件中不同參與者的音頻信息;
可選的,區分信息包括:硬件區分標識、聲紋特征、音頻信息的輸入方向;
區分單元具體用于:
區分信息包括硬件區分標識時,預先設置每一個用于輸入音頻信息的硬件相對應的硬件區分標識,并在音頻文件中添加硬件區分標識;根據硬件區分標識區分音頻文件中每一個參與者輸入的音頻信息;
需要說明的是,如果輸入音頻信息的硬件本身具備相對應的物理標識,則可以直接將硬件本身具備的物理標識作為本發明實施例的硬件區分標識。在音頻信息中添加硬件區分標識時,本發明實施例陳述的音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過讀取音頻文件中的硬件區分標識可以區分不同參與者的音頻信息;方法一可以適用于不同參與者分別使用獨立的麥克的會議或辯論場景,參與者通過麥克發言時,可以直接在音頻信息中添加硬件區分標識,直接區分不同參與者輸入的音頻信息。
可選的,區分單元具體用于:
區分信息包括聲紋特征時,提取音頻文件中音頻信息的聲紋特征,將提取的聲紋特征與預先存儲的每一個參與者的聲紋特征進行匹配;根據聲紋特征的匹配結果區分每一個參與者的音頻信息。
需要說的是,通過提取聲紋特征識別上述音頻文件中每一個參與者的音頻信息時,本發明實施例音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過提取的音頻文件中包含的音頻信息的聲紋特征,將提取的聲紋特征和預先存儲的每一個參與者的聲紋特征進行匹配,可以區分音頻文件中每一個參與者的音頻信息;
可選的,區分單元具體用于:
區分信息包括音頻信息的輸入方向時,確定音頻文件包含的音頻信息的輸入方向;根據輸入方向的不同區分每一個參與者輸入的音頻信息。
需要說的是,本發明實施例通過音頻信息的輸入方向確定每一個參與者的音頻信息時,音頻文件可以是正在錄制的音頻文件,音頻信息的輸入方向可以通過預先設置的傳感器進行區分;例如、設置標準坐標后,設定每隔一個預設角度為一個方向,根據預設角度設定方向后,根據參與者所處位置的不同區分不同參與者的音頻信息。
本發明實施例采用上述三種方法中的一種方法區分不同參與者的音頻信息后,分割音頻文件中不同參與者的音頻信息并存儲為對應于參與者的參與者音頻文件可以采用相關技術中的音頻處理方法實現。
本發明實施例可以以手機、平板、電腦、錄音機等設備作為硬件執行主體。
存儲單元用于,將區分出的不同參與者的音頻信息,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件。
需要說明的是,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,提高了對音頻文件的查看效率。以會議錄制的音頻文件為例,假設會議上有5名參會成員發言,且會議進行過程中5名參會人員進行了多輪的意見發表,假設會議結束后,參會人員覺得參會成員A在會議發言的內容對會議要討論的項目具有積極的意義,因此建議查看參會成員A的發言的內容;如果按照相關技術的處理方法,需要從頭到尾的播放錄制的音頻文件;如果需要多次查看,或者會議包含多個階段,則查看參會成員A的發言的內容過程十分繁瑣,效率低;采用本發明實施例,由于將各參會成員的音頻信息區分并存儲為對應于參與者的參與者音頻文件;查看參與成員A的會議發言時,只需要針對存儲的對應于參會成員A的參與者音頻文件即可,提高了音頻信息的查看效率。
可選的,存儲單元具體用于:
將區分的每一個參與者的音頻信息添加區分標記信息后,分別存儲為包含區分標記信息的對應于參與者的參與者音頻文件;
區分標記信息包括以下任意信息的組合:區分名稱、區分編碼。
需要說明的是,本發明實施例區分標記信息可以僅包含區分名稱,或僅包含區分編碼;區分名稱可以是參與者的賬戶名、參與者的席位名等;區分編碼可以是新建的排序編碼、員工編號、及其他可以區分不同參與者的編碼。
可選的,本發明實施例存儲單元還用于:
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件分別存儲在對應的預設文件夾中;或,
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件通過預設的區分目錄進行存儲。
需要說的是,本發明實施例可以在區分不同參與者的參與者音頻文件后,分別存儲在對應的預設文件夾中;假設會議的音頻文件經過本發明實施例區分音頻信息后,確認包含張三、李四、趙五的參與者音頻文件,則可以分別設置張三、李四、趙五的文件夾,并將每一個文件夾路徑作為每一個參與者的參與者音頻文件的存儲路徑,分別存儲張三、李四、趙五的參與者音頻文件。
本發明實施例也可以采用區分目錄的方式對不同參與者的參與者音頻文件進行存儲,依舊以張三、李四、趙五的參與者音頻文件為例,通過目錄名稱將張三、李四、趙五的參與者音頻文件進行了區分,通過區分目錄可以高效的查找指定參與者的參與者音頻文件;本發明實施例一個參與者包含多個參與者音頻文件時,可以按照時間先后順序進行排序存儲,相應的,可以將排序存儲的同一個參與者的多個參與者音頻文件進行編號排序;例如、從音頻文件中區分出三段張三的音頻信息,將三段張三的音頻信息存儲為三個對應于張三的參與者對應的參與者音頻文件,則可以存儲為張三音頻文件1、張三音頻文件2和張三音頻文件3。
本發明實施例裝置還包括添加單元,用于在區分的每一個參與者的音頻信息中添加時間信息。
需要說明的是,本發明實施例時間信息可以是時間戳信息,也可以是排序先后的信息,對于同一個參與者不同時間段的音頻信息,可以分別存儲為對于的參與者音頻文件,同一參與者的不同時間段的參與者音頻文件可以通過時間戳信息或排序先后信息進行區分。在音頻信息中添加的是時間戳信息時,可以根據錄制音頻文件的時間以及音頻信息所處時間段進行確定。
本發明實施例,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,節省了查看音頻文件的時間,提高了對音頻文件的查看效率。
本發明實施例還提供一種實現音頻處理的裝置,包括:區分單元、添加單元和存儲單元;其中,
區分單元用于,獲取音頻文件中的區分信息,根據區分信息區分音頻文件中不同參與者的音頻信息;
可選的,區分信息包括:硬件區分標識、聲紋特征、音頻信息的輸入方向;
可選的,區分單元具體用于:
區分信息包括硬件區分標識時,預先設置每一個用于輸入音頻信息的硬件相對應的硬件區分標識,并在音頻文件中添加硬件區分標識;根據硬件區分標識區分音頻文件中每一個參與者輸入的音頻信息;
需要說明的是,如果輸入音頻信息的硬件本身具備相對應的物理標識,則可以直接將硬件本身具備的物理標識作為本發明實施例的硬件區分標識。在音頻信息中添加硬件區分標識時,本發明實施例陳述的音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過讀取音頻文件中的硬件區分標識可以區分不同參與者的音頻信息;方法一可以適用于不同參與者分別使用獨立的麥克的會議或辯論場景,參與者通過麥克發言時,可以直接在音頻信息中添加硬件區分標識,直接區分不同參與者輸入的音頻信息。
可選的,區分單元具體用于:
區分信息包括聲紋特征時,提取音頻文件中音頻信息的聲紋特征,將提取的聲紋特征與預先存儲的每一個參與者的聲紋特征進行匹配;根據聲紋特征的匹配結果區分每一個參與者的音頻信息。
需要說的是,通過提取聲紋特征識別上述音頻文件中每一個參與者的音頻信息時,本發明實施例音頻文件可以是正在錄制的音頻文件,也可以是已經錄制完成的音頻文件,通過提取的音頻文件中包含的音頻信息的聲紋特征,將提取的聲紋特征和預先存儲的每一個參與者的聲紋特征進行匹配,可以區分音頻文件中每一個參與者的音頻信息;
可選的,區分單元具體用于:
區分信息包括音頻信息的輸入方向時,確定音頻文件包含的音頻信息的輸入方向;根據輸入方向的不同區分每一個參與者輸入的音頻信息。
需要說的是,本發明實施例通過音頻信息的輸入方向確定每一個參與者的音頻信息時,音頻文件可以是正在錄制的音頻文件,音頻信息的輸入方向可以通過預先設置的傳感器進行區分;例如、設置標準坐標后,設定每隔一個預設角度為一個方向,根據預設角度設定方向后,根據參與者所處位置的不同區分不同參與者的音頻信息。
本發明實施例采用上述三種方法中的一種方法區分不同參與者的音頻信息后,分割音頻文件中不同參與者的音頻信息并存儲為對應于參與者的參與者音頻文件可以采用相關技術中的音頻處理方法實現。
本發明實施例可以以手機、平板、電腦、錄音機等設備作為硬件執行主體。
添加單元,用于在區分的每一個參與者的音頻信息中添加時間信息。
需要說明的是,本發明實施例時間信息可以是時間戳信息,也可以是排序先后的信息,對于同一個參與者不同時間段的音頻信息,可以分別存儲為對于的參與者音頻文件,同一參與者的不同時間段的參與者音頻文件可以通過時間戳信息或排序先后信息進行區分。在音頻信息中添加的是時間戳信息時,可以根據錄制音頻文件的時間以及音頻信息所處時間段進行確定。
存儲單元用于,將區分出的不同參與者的音頻信息,按照參與者的不同分別存儲為對應于參與者的參與者音頻文件。
需要說明的是,將音頻文件中不同參與者的音頻信息存儲為對應于參與者的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,提高了對音頻文件的查看效率。以會議錄制的音頻文件為例,假設會議上有5名參會成員發言,且會議進行過程中5名參會人員進行了多輪的意見發表,假設會議結束后,參會人員覺得參會成員A在會議發言的內容對會議要討論的項目具有積極的意義,因此建議查看參會成員A的發言的內容;如果按照相關技術的處理方法,需要從頭到尾的播放錄制的音頻文件;如果需要多次查看,或者會議包含多個階段,則查看參會成員A的發言的內容過程十分繁瑣,效率低;采用本發明實施例,由于將各參會成員的音頻信息區分并存儲為對應于參與者的參與者音頻文件;查看參與成員A的會議發言時,只需要針對存儲的對應于參會成員A的參與者音頻文件即可,提高了音頻信息的查看效率。
可選的,存儲單元具體用于:
將區分的每一個參與者的音頻信息添加區分標記信息后,分別存儲為包含區分標記信息的對應于參與者的參與者音頻文件;
區分標記信息包括以下任意信息的組合:區分名稱、區分編碼。
需要說明的是,本發明實施例區分標記信息可以僅包含區分名稱,或僅包含區分編碼;區分名稱可以是參與者的賬戶名、參與者的席位名等;區分編碼可以是新建的排序編碼、員工編號、及其他可以區分不同參與者的編碼。
可選的,本發明實施例存儲單元還用于:
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件分別存儲在對應的預設文件夾中;或,
將從音頻文件中區分并存儲的對應于參與者的參與者音頻文件通過預設的區分目錄進行存儲。
需要說的是,本發明實施例可以在區分不同參與者的參與者音頻文件后,分別存儲在對應的預設文件夾中;假設會議的音頻文件經過本發明實施例區分音頻信息后,確認包含張三、李四、趙五的參與者音頻文件,則可以分別設置張三、李四、趙五的文件夾,并將每一個文件夾路徑作為每一個參與者的參與者音頻文件的存儲路徑,分別存儲張三、李四、趙五的參與者音頻文件。
本發明實施例也可以采用區分目錄的方式對不同參與者的參與者音頻文件進行存儲,依舊以張三、李四、趙五的參與者音頻文件為例,通過目錄名稱將張三、李四、趙五的參與者音頻文件進行了區分,通過區分目錄可以高效的查找指定參與者的參與者音頻文件;本發明實施例一個參與者包含多個參與者音頻文件時,可以按照時間先后順序進行排序存儲,相應的,可以將排序存儲的同一個參與者的多個參與者音頻文件進行編號排序;例如、從音頻文件中區分出三段張三的音頻信息,將三段張三的音頻信息存儲為三個對應于張三的參與者音頻文件,則可以存儲為張三音頻文件1、張三音頻文件2和張三音頻文件3。
本發明實施例,將音頻文件中不同參與者的音頻信息存儲為對應于不同參與者的參與者對應的參與者音頻文件,在需要對音頻文件中特定參與者的發言進行回顧查看時,僅需要對存儲的對應于特定參與者的參與者音頻文件進行查看即可,節省了查看音頻文件的時間,提高了對音頻文件的查看效率。
本領域普通技術人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關硬件(例如處理器)完成,所述程序可以存儲于計算機可讀存儲介質中,如只讀存儲器、磁盤或光盤等。可選地,上述實施例的全部或部分步驟也可以使用一個或多個集成電路來實現。相應地,上述實施例中的每個模塊/單元可以采用硬件的形式實現,例如通過集成電路來實現其相應功能,也可以采用軟件功能模塊的形式實現,例如通過處理器執行存儲于存儲器中的程序/指令來實現其相應功能。本發明不限制于任何特定形式的硬件和軟件的結合。
雖然本發明所揭露的實施方式如上,但所述的內容僅為便于理解本發明而采用的實施方式,并非用以限定本發明。任何本發明所屬領域內的技術人員,在不脫離本發明所揭露的精神和范圍的前提下,可以在實施的形式及細節上進行任何的修改與變化,但本發明的專利保護范圍,仍須以所附的權利要求書所界定的范圍為準。