技術總結
本發明公開了一種音頻數據自動增益控制方法與裝置,其中方法包括:對音頻數據進行分幀處理,并提取各幀數據的特征參數;根據當前幀數據的特征參數與語音類別高斯混合模型得到當前幀數據的語音類條件概率;根據當前幀數據的特征參數與噪聲類別高斯混合模型得到當前幀數據的噪聲類條件概率,并計算所述當前幀數據屬于語音幀的概率以及屬于噪聲幀的概率;當屬于語音幀的概率大于屬于噪聲幀的概率時,將當前幀音頻數據判定為語音幀,按照語音幀增益控制規則控制其增益;反之,將當前幀數據判定為噪聲幀,按照噪聲幀增益控制規則控制其增益。本發明技術方案極大地提高了語音與噪聲的識別水平,并依此進行自動增益控制,有效改善了使用者的體驗。
技術研發人員:雷延強;程雪峰
受保護的技術使用者:廣州視源電子科技股份有限公司
文檔號碼:201611169178
技術研發日:2016.12.16
技術公布日:2017.05.10