1.一種歌曲音頻拼接方法,其特征在于,所述方法包括:
獲取多個用戶針對目標(biāo)歌曲的演繹音頻數(shù)據(jù),所述演繹音頻數(shù)據(jù)包括所述目標(biāo)歌曲的各個分句的清唱音頻數(shù)據(jù);
分別提取各用戶演繹的各個分句的清唱音頻數(shù)據(jù)的基頻信息,獲取各個分句的不同用戶的清唱音頻數(shù)據(jù)的基頻信息對應(yīng)的音符值序列;
計算所述多個用戶中的目標(biāo)用戶演繹目標(biāo)分句的音符值序列分別與所述多個用戶中其他用戶演繹目標(biāo)分句的音符值序列之間的基頻距離的和,作為所述目標(biāo)用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和;
根據(jù)各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和,從所述各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)中確定所述目標(biāo)歌曲中的目標(biāo)分句對應(yīng)的分句清唱音頻數(shù)據(jù);
根據(jù)目標(biāo)歌曲的各個分句對應(yīng)的分句清唱音頻數(shù)據(jù),生成所述目標(biāo)歌曲的拼接音頻數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和,從所述各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)中確定所述目標(biāo)歌曲中的目標(biāo)分句對應(yīng)的分句清唱音頻數(shù)據(jù)包括:
按照基頻距離和從小到大,對各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)進(jìn)行排序;
獲取排序前N個清唱音頻數(shù)據(jù)作為所述目標(biāo)分句的備選清唱音頻數(shù)據(jù),從所述備選清唱音頻數(shù)據(jù)中選擇其中一個清唱音頻數(shù)據(jù)作為所述目標(biāo)歌曲中的目標(biāo)分句對應(yīng)的分句清唱音頻數(shù)據(jù)。
3.如權(quán)利要求2所述的方法,其特征在于,所述獲取排序前N個清唱音頻數(shù)據(jù)作為所述目標(biāo)分句的備選清唱音頻數(shù)據(jù)包括:
根據(jù)各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和,計算各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的置信度;
將置信度達(dá)到預(yù)設(shè)置信度閾值的排序前N個清唱音頻數(shù)據(jù)作為所述目標(biāo)分句的備選清唱音頻數(shù)據(jù),N由置信度達(dá)不到預(yù)設(shè)置信度閾值的基頻距離和最小的清唱音頻數(shù)據(jù)的排序確定。
4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和,計算各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的置信度包括:
在各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)中,根據(jù)排序第1個清唱音頻數(shù)據(jù)的基頻距離和與排序前M個清唱音頻數(shù)據(jù)的基頻距離和之間的比較結(jié)果,確定排序第1個清唱音頻數(shù)據(jù)的置信度;
根據(jù)所述排序第1個清唱音頻數(shù)據(jù)的基頻距離和與其他各個清唱音頻數(shù)據(jù)的基頻距離和的比較結(jié)果,確定其他各個清唱音頻數(shù)據(jù)的置信度。
5.如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)目標(biāo)歌曲的各個分句對應(yīng)的分句清唱音頻數(shù)據(jù),生成所述目標(biāo)歌曲的拼接音頻數(shù)據(jù)之前還包括:
分別提取各用戶演繹的目標(biāo)歌曲的演繹音頻數(shù)據(jù)的基頻信息,獲取不同用戶的演繹音頻數(shù)據(jù)的基頻信息對應(yīng)的音符值序列;
計算所述多個用戶中的目標(biāo)用戶的演繹音頻數(shù)據(jù)的音符值序列分別與所述多個用戶中其他用戶的演繹音頻數(shù)據(jù)的音符值序列之間的基頻距離的和,作為所述目標(biāo)用戶的演繹音頻數(shù)據(jù)的基頻距離和;
根據(jù)各個用戶的演繹音頻數(shù)據(jù)的基頻距離和,將基頻距離和最小的演繹音頻數(shù)據(jù)作為參考清唱音頻數(shù)據(jù);
確定所述目標(biāo)歌曲的各個分句對應(yīng)的分句清唱音頻數(shù)據(jù)與所述參考清唱音頻數(shù)據(jù)的相應(yīng)分句的清唱音頻數(shù)據(jù)之間的基調(diào)差均小于預(yù)設(shè)基調(diào)閾值。
6.如權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
若所述目標(biāo)歌曲的各個分句對應(yīng)的分句清唱音頻數(shù)據(jù)與所述參考清唱音頻數(shù)據(jù)的相應(yīng)分句的清唱音頻數(shù)據(jù)之間的基調(diào)差不能滿足均小于預(yù)設(shè)基調(diào)閾值,則重新從各個分句對應(yīng)的備選清唱音頻數(shù)據(jù)中選擇其中的清唱音頻數(shù)據(jù)作為所述目標(biāo)歌曲中的目標(biāo)分句對應(yīng)的分句清唱音頻數(shù)據(jù),直至各個分句對應(yīng)的分句清唱音頻數(shù)據(jù)與所述參考清唱音頻數(shù)據(jù)的相應(yīng)分句的清唱音頻數(shù)據(jù)之間的基調(diào)差均小于預(yù)設(shè)基調(diào)閾值。
7.如權(quán)利要求1-6所述的任一方法,其特征在于,所述分別提取各用戶演繹的各個分句的清唱音頻數(shù)據(jù)的基頻信息,獲取各個分句的不同用戶的清唱音頻數(shù)據(jù)的基頻信息對應(yīng)的音符值序列包括:
按照預(yù)設(shè)幀長和預(yù)設(shè)幀移分別提取各用戶演繹的各個分句的清唱音頻數(shù)據(jù)的基頻信息,以生成各用戶演繹的各個分句對應(yīng)的至少一個基頻點;
對所述至少一個基頻點中各基頻點的基頻值進(jìn)行調(diào)整,并將調(diào)整后的所述各基頻點的基頻值轉(zhuǎn)換為所述各基頻點對應(yīng)的音符值,從而獲取各個分句的不同用戶的清唱音頻數(shù)據(jù)的基頻信息對應(yīng)的音符值序列。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述對所述至少一個基頻點中各基頻點的基頻值進(jìn)行調(diào)整包括:
對所述至少一個基頻點中的奇異基頻點的基頻值進(jìn)行置零處理;
對所述各基頻點進(jìn)行中值濾波處理。
9.一種歌曲音頻拼接設(shè)備,其特征在于,所述設(shè)備包括:
數(shù)據(jù)獲取單元,用于獲取多個用戶針對目標(biāo)歌曲的演繹音頻數(shù)據(jù),所述演繹音頻數(shù)據(jù)包括所述目標(biāo)歌曲的各個分句的清唱音頻數(shù)據(jù);
第一音符值轉(zhuǎn)換單元,用于分別提取各用戶演繹的各個分句的清唱音頻數(shù)據(jù)的基頻信息,獲取各個分句的不同用戶的清唱音頻數(shù)據(jù)的基頻信息對應(yīng)的音符值序列;
第一計算單元,用于計算所述多個用戶中的目標(biāo)用戶演繹目標(biāo)分句的音符值序列分別與所述多個用戶中其他用戶演繹目標(biāo)分句的音符值序列之間的基頻距離的和,作為所述目標(biāo)用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和;
第一分句數(shù)據(jù)選擇單元,用于根據(jù)各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和,從所述各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)中確定所述目標(biāo)歌曲中的目標(biāo)分句對應(yīng)的分句清唱音頻數(shù)據(jù);
數(shù)據(jù)生成單元,用于根據(jù)目標(biāo)歌曲的各個分句對應(yīng)的分句清唱音頻數(shù)據(jù),生成所述目標(biāo)歌曲的拼接音頻數(shù)據(jù)。
10.如權(quán)利要求9所述的設(shè)備,其特征在于,所述第一分句數(shù)據(jù)選擇單元包括:
數(shù)據(jù)排序子單元,用于按照基頻距離和從小到大,對各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)進(jìn)行排序;
備選數(shù)據(jù)獲取子單元,用于獲取排序前N個清唱音頻數(shù)據(jù)作為所述目標(biāo)分句的備選清唱音頻數(shù)據(jù),從所述備選清唱音頻數(shù)據(jù)中選擇其中一個清唱音頻數(shù)據(jù)作為所述目標(biāo)歌曲中的目標(biāo)分句對應(yīng)的分句清唱音頻數(shù)據(jù)。
11.如權(quán)利要求10所述的設(shè)備,其特征在于,所述數(shù)據(jù)排序子單元用于:
根據(jù)各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的基頻距離和,計算各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)的置信度;
將置信度達(dá)到預(yù)設(shè)置信度閾值的排序前N個清唱音頻數(shù)據(jù)作為所述目標(biāo)分句的備選清唱音頻數(shù)據(jù),N由置信度達(dá)不到預(yù)設(shè)置信度閾值的基頻距離和最小的清唱音頻數(shù)據(jù)的排序確定。
12.如權(quán)利要求11所述的設(shè)備,其特征在于,所述數(shù)據(jù)排序子單元用于:
在各個用戶演繹目標(biāo)分句的清唱音頻數(shù)據(jù)中,根據(jù)排序第1個清唱音頻數(shù)據(jù)的基頻距離和與排序前M個清唱音頻數(shù)據(jù)的基頻距離和之間的比較結(jié)果,確定排序第1個清唱音頻數(shù)據(jù)的置信度;
根據(jù)所述排序第1個清唱音頻數(shù)據(jù)的基頻距離和與其他各個清唱音頻數(shù)據(jù)的基頻距離和的比較結(jié)果,確定其他各個清唱音頻數(shù)據(jù)的置信度。
13.如權(quán)利要求10所述的設(shè)備,其特征在于,所述設(shè)備還包括:
第二音符值轉(zhuǎn)換單元,用于分別提取各用戶演繹的目標(biāo)歌曲的演繹音頻數(shù)據(jù)的基頻信息,獲取不同用戶的演繹音頻數(shù)據(jù)的基頻信息對應(yīng)的音符值序列;
第二計算單元,用于計算所述多個用戶中的目標(biāo)用戶的演繹音頻數(shù)據(jù)的音符值序列分別與所述多個用戶中其他用戶的演繹音頻數(shù)據(jù)的音符值序列之間的基頻距離的和,作為所述目標(biāo)用戶的演繹音頻數(shù)據(jù)的基頻距離和;
參考數(shù)據(jù)選擇單元,用于根據(jù)各個用戶的演繹音頻數(shù)據(jù)的基頻距離和,將基頻距離和最小的演繹音頻數(shù)據(jù)作為參考清唱音頻數(shù)據(jù);
基調(diào)差確定單元,用于確定所述目標(biāo)歌曲的各個分句對應(yīng)的分句清唱音頻數(shù)據(jù)與所述參考清唱音頻數(shù)據(jù)的相應(yīng)分句的清唱音頻數(shù)據(jù)之間的基調(diào)差均小于預(yù)設(shè)基調(diào)閾值。
14.如權(quán)利要求13所述的設(shè)備,其特征在于,所述設(shè)備還包括:
第二分句數(shù)據(jù)選擇單元,用于若所述目標(biāo)歌曲的各個分句對應(yīng)的分句清唱音頻數(shù)據(jù)與所述參考清唱音頻數(shù)據(jù)的相應(yīng)分句的清唱音頻數(shù)據(jù)之間的基調(diào)差不能滿足均小于預(yù)設(shè)基調(diào)閾值,則重新從各個分句對應(yīng)的備選清唱音頻數(shù)據(jù)中選擇其中的清唱音頻數(shù)據(jù)作為所述目標(biāo)歌曲中的目標(biāo)分句對應(yīng)的分句清唱音頻數(shù)據(jù),直至各個分句對應(yīng)的分句清唱音頻數(shù)據(jù)與所述參考清唱音頻數(shù)據(jù)的相應(yīng)分句的清唱音頻數(shù)據(jù)之間的基調(diào)差均小于預(yù)設(shè)基調(diào)閾值。
15.如權(quán)利要求9-14所述的任一設(shè)備,其特征在于,所述第一音符值轉(zhuǎn)換單元包括:
基頻點生成子單元,用于按照預(yù)設(shè)幀長和預(yù)設(shè)幀移分別提取各用戶演繹的各個分句的清唱音頻數(shù)據(jù)的基頻信息,以生成各用戶演繹的各個分句對應(yīng)的至少一個基頻點;
第一音符值轉(zhuǎn)換子單元,用于對所述至少一個基頻點中各基頻點的基頻值進(jìn)行調(diào)整,并將調(diào)整后的所述各基頻點的基頻值轉(zhuǎn)換為所述各基頻點對應(yīng)的音符值,從而獲取各個分句的不同用戶的清唱音頻數(shù)據(jù)的基頻信息對應(yīng)的音符值序列。
16.根據(jù)權(quán)利要求15所述的設(shè)備,其特征在于,所述第一音符值轉(zhuǎn)換子單元用于:
對所述至少一個基頻點中的奇異基頻點的基頻值進(jìn)行置零處理;
對所述各基頻點進(jìn)行中值濾波處理。