摘要:本發(fā)明公開了一種基于能量統(tǒng)計的語音音量自動調(diào)整方法。本發(fā)明包括如下步驟:(1)統(tǒng)計每幀采樣點的能量平均值energy和該幀中所有采樣點能量值的絕對值中的最大值峰值peak;(2)計算0到frame_index幀中每幀采樣點的能量平均值energy的平均值energy_avg和最大值峰值peak的平均值peak_avg;(3)計算下個時間段time內(nèi)的放大因子factor_max′和縮小因子factor_min′;(4)對下個時間段time內(nèi)的每幀語音數(shù)據(jù)進行判定,當需要縮放時,通過縮放因子進行放大或者縮?。?5)將處理好后的語音數(shù)據(jù)幀輸出,結(jié)束。本發(fā)明利用語音數(shù)據(jù)的相似性和持續(xù)性,根據(jù)前一段時間的語音數(shù)據(jù)統(tǒng)計信息,來預測下一段時間需要用到的放大因子和縮小因子,在滿足實用性的同時盡量降低算法的復雜度。
- 專利類型發(fā)明專利
- 申請人浙江萬朋網(wǎng)絡技術(shù)有限公司;
- 發(fā)明人松春鋒;
- 地址310013 浙江省杭州市文三西路118號電子商務大廈15樓
- 申請?zhí)?/b>CN201510109054.6
- 申請時間2015年03月12日
- 申請公布號CN104699447A
- 申請公布時間2015年06月10日
- 分類號G06F3/16(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

