摘要:本發(fā)明公開了一種具有語音控制和哼唱檢索功能的多媒體播放方法及裝置,方法步驟如下:用戶選擇工作模式,采集語音數(shù)據(jù)并預(yù)處理,語音控制模式下,將語音數(shù)據(jù)與語法規(guī)則上傳至語音識(shí)別服務(wù)端進(jìn)行語音識(shí)別,根據(jù)識(shí)別結(jié)果進(jìn)行播放控制或者資源管理;哼唱檢索模式下,將語音數(shù)據(jù)提取基音序列并轉(zhuǎn)換為音符序列,通過匹配搜索服務(wù)端找到與匹配的多媒體資源身份信息,并下載對(duì)應(yīng)的多媒體資源到本地;裝置包括人機(jī)交互模塊、語音輸入模塊、語音數(shù)據(jù)處理模塊、中央處理器、媒體存儲(chǔ)模塊、播放解碼模塊、音頻輸出模塊、網(wǎng)絡(luò)接口模塊、匹配搜索服務(wù)端等。本發(fā)明具有能夠解放用戶的雙手、用戶體驗(yàn)好、使用方便、哼唱檢測(cè)精確、應(yīng)用范圍廣的優(yōu)點(diǎn)。
- 專利類型發(fā)明專利
- 申請(qǐng)人湖南大學(xué);
- 發(fā)明人趙歡;
- 地址410082 湖南省長(zhǎng)沙市河西岳麓山湖南大學(xué)信息科學(xué)與工程學(xué)院
- 申請(qǐng)?zhí)?/b>CN201310298771.9
- 申請(qǐng)時(shí)間2013年07月16日
- 申請(qǐng)公布號(hào)CN103366784A
- 申請(qǐng)公布時(shí)間2013年10月23日
- 分類號(hào)G11B27/10(2006.01)I;G10L15/30(2013.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號(hào)

