摘要:本發(fā)明涉及語音識別技術(shù)領(lǐng)域,特別涉及一種將語音數(shù)據(jù)轉(zhuǎn)換為文本文件的方法和系統(tǒng)。所述方法包括:開始采集語音數(shù)據(jù),將語音數(shù)據(jù)轉(zhuǎn)換為文本文字;提取出第一份音色數(shù)據(jù),標記所述音色數(shù)據(jù)并儲存;將文本文字儲存為對應(yīng)所述已標記的音色數(shù)據(jù)的文本文件;從預(yù)設(shè)的信號采集時間間隔內(nèi)采集的語音數(shù)據(jù)中提取出音色數(shù)據(jù),并將所述音色數(shù)據(jù)與已標記的所有音色數(shù)據(jù)逐一進行對比;如果音色數(shù)據(jù)相同,則將轉(zhuǎn)換成的文本文字儲存至與所述已標記的音色數(shù)據(jù)對應(yīng)的文本文件;如果音色數(shù)據(jù)不同,則標記所述音色數(shù)據(jù)并儲存,將轉(zhuǎn)換成的文本文字儲存為對應(yīng)所述音色數(shù)據(jù)的另一文本文件。本發(fā)明能區(qū)分不同發(fā)言人的發(fā)言內(nèi)容,簡化了錄音后的人工整理工作,省時省力。
- 專利類型發(fā)明專利
- 申請人廣東威創(chuàng)視訊科技股份有限公司;
- 發(fā)明人劉觀發(fā);
- 地址510663 廣東省廣州市廣州高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)彩頻路6號
- 申請?zhí)?/b>CN201110436096.2
- 申請時間2011年12月22日
- 申請公布號CN102522084A
- 申請公布時間2012年06月27日
- 分類號G10L15/26(2006.01)I;G10L15/08(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

