摘要:本發(fā)明涉及基于聲學(xué)統(tǒng)計模型的單元挑選語音合成方法,其方法包括提取訓(xùn)練語料庫各聲學(xué)特征;結(jié)合訓(xùn)練語料庫中各句話的音段、韻律等標(biāo)注信息,訓(xùn)練各種聲學(xué)特征所對應(yīng)的統(tǒng)計模型,在合成時通過對輸入文本進(jìn)行文本分析,得到待合成句子中各音素對應(yīng)的各種聲學(xué)特征的統(tǒng)計模型。以備選單元序列包含的聲學(xué)參數(shù)相對于待合成句的聲學(xué)統(tǒng)計模型具有最大的似然值為準(zhǔn)則,搜索最優(yōu)的備選單元;使用聲學(xué)統(tǒng)計模型間的KLD來實現(xiàn)合成單元的快速預(yù)挑選;最終通過對各個音素的最優(yōu)備選單元的波形進(jìn)行平滑和拼接,得到該句話的合成語音。本發(fā)明提高合成語音音質(zhì);同時提高傳統(tǒng)拼接合成方法的合成效果,并且可以實現(xiàn)系統(tǒng)的自動構(gòu)建和語種的無關(guān)性。
- 專利類型發(fā)明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發(fā)明人凌震華;胡郁;胡國平;吳曉如;劉慶峰;王仁華;
- 地址230088 安徽省合肥市高新區(qū)黃山路616號信息產(chǎn)業(yè)基地
- 申請?zhí)?/b>CN200710191078.6
- 申請時間2007年12月06日
- 申請公布號CN101178896B
- 申請公布時間2012年03月28日
- 分類號G10L13/02(2006.01)I;G10L13/06(2006.01)I;G10L13/08(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

