摘要:進(jìn)行音頻斷句的自動(dòng)拆分方法及系統(tǒng),包括:根據(jù)音頻獲取多個(gè)分幀段;根據(jù)各分幀段的能量值獲取能量閾值,根據(jù)所述能量閾值,從所述各分幀段中獲取其能量值超過(guò)能量閾值Et;的分幀段,則以該分幀段為句中間幀對(duì)該幀的前序幀或后序幀進(jìn)行掃描,若前序幀或后序幀的能量閥值小于設(shè)定能量閾值Et,則將該幀與所述句中間幀按幀起始順序合并成為獨(dú)立句,之后對(duì)每個(gè)獨(dú)立句進(jìn)行譜熵分析,獲取最后的分析句子。從而解決了現(xiàn)有字幕對(duì)應(yīng)過(guò)程中,無(wú)法進(jìn)行自動(dòng)斷句的問(wèn)題。從而,本發(fā)明既可以處理已經(jīng)錄制好的音視頻,也可以處理正在直播的音視頻。對(duì)于網(wǎng)絡(luò)直播流,能夠自動(dòng)的將網(wǎng)絡(luò)直播語(yǔ)音切割,方便后續(xù)環(huán)節(jié)如聽(tīng)寫(xiě)環(huán)節(jié)并行處理,加快處理時(shí)間。
- 專利類型發(fā)明專利
- 申請(qǐng)人北京華科飛揚(yáng)科技股份公司;
- 發(fā)明人胡飛;
- 地址100000 北京市朝陽(yáng)區(qū)小營(yíng)路13號(hào)1號(hào)樓5006室
- 申請(qǐng)?zhí)?/b>CN201610799257.7
- 申請(qǐng)時(shí)間2016年08月31日
- 申請(qǐng)公布號(hào)CN106157951A
- 申請(qǐng)公布時(shí)間2016年11月23日
- 分類號(hào)G10L15/04(2013.01)I;G10L25/21(2013.01)I;G10L21/10(2013.01)I;




教育裝備采購(gòu)網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號(hào)

