摘要:本發(fā)明涉及句子層面的大規(guī)??焖倨ヅ浞椒?,本方法包括索引建立、模糊匹配和精確匹配三個階段。索引建立階段進行句子內(nèi)容的標準化、編碼轉(zhuǎn)換;模糊匹配階段的目的是從海量句子中挑選出可能與新句子匹配的候選句子,其數(shù)量控制在一個可行的范圍內(nèi);精確匹配階段采用了基于編輯距離的相似性衡量算法,再根據(jù)精確匹配的相似性對候選句子排序得到最終匹配的句子。本發(fā)明方法的優(yōu)點是實際測試性能優(yōu)異,搜索效率高、漏檢率低,滿足實用要求。
- 專利類型發(fā)明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發(fā)明人陳志剛;胡國平;胡郁;劉慶峰;王仁華;
- 地址230088安徽省合肥市高新區(qū)黃山路616號信息產(chǎn)業(yè)基地
- 申請?zhí)?/b>CN200810107117.4
- 申請時間2008年07月17日
- 申請公布號CN101329680A
- 申請公布時間2008年12月24日
- 分類號G06F17/30(2006.01);




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

