摘要:本發(fā)明公開了一種基于深度學(xué)習(xí)的誤發(fā)音檢測方法和裝置,方法包括:步驟1)通過朗讀音頻提取聲學(xué)特征,通過朗讀文本和相應(yīng)的單詞發(fā)音字典構(gòu)建音素級解碼網(wǎng)絡(luò);步驟2)結(jié)合聲學(xué)特征和預(yù)先訓(xùn)練好的聲學(xué)模型對音素級解碼網(wǎng)絡(luò)進(jìn)行解碼確定待檢測音素的邊界;基于由深度神經(jīng)網(wǎng)絡(luò)構(gòu)成的深度自動編碼器,根據(jù)音素的邊界和邊界內(nèi)的聲學(xué)特征提取音素級特征,所述深度神經(jīng)網(wǎng)絡(luò)為一深度貝葉斯置信網(wǎng)絡(luò);將待檢測音素的音素級特征送入事先訓(xùn)練好的發(fā)音正誤分類器,判斷待檢測音素的發(fā)音正誤。
- 專利類型發(fā)明專利
- 申請人蘇州馳聲信息科技有限公司;
- 發(fā)明人惠寅華;王歡良;楊嵩;黃正偉;方敏;袁軍峰;戚自力;
- 地址215000 江蘇省蘇州市工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園9-902單元
- 申請?zhí)?/b>CN201610662367.9
- 申請時間2016年08月12日
- 申請公布號CN106297828A
- 申請公布時間2017年01月04日
- 分類號G10L25/78(2013.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

