摘要:本發(fā)明公開了一種文本相似度計算方法及裝置,涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,用于解決現(xiàn)有文本相似度計算效率低的問題,本發(fā)明的主要技術(shù)方案為:在文本中滾動預(yù)置長度的窗口,每滾動一次獲取一個字符長度與窗口長度相同的窗口特征詞向量;根據(jù)所述窗口特征詞向量生成與所述文本對應(yīng)的唯一標(biāo)識數(shù)據(jù);通過對不同文本的唯一標(biāo)識數(shù)據(jù)的比較,確定不同文本之間的相似度結(jié)果。本發(fā)明主要用于計算文本相似度。
- 專利類型發(fā)明專利
- 申請人東軟集團(tuán)股份有限公司;
- 發(fā)明人張明亮;齊勇;王明強(qiáng);
- 地址110179 遼寧省沈陽市渾南新區(qū)新秀街2號
- 申請?zhí)?/b>CN201610751935.2
- 申請時間2016年08月29日
- 申請公布號CN106469144A
- 申請公布時間2017年03月01日
- 分類號G06F17/27(2006.01)I;G06F17/30(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

