摘要:本發(fā)明公開了一種快速內(nèi)容分析的多關(guān)鍵詞匹配方法。所述發(fā)明方法包括預處理階段和模式匹配階段。其中,所述的預處理階段包括關(guān)鍵詞特征串裁剪和關(guān)鍵詞特征分片集合的構(gòu)建、基于關(guān)鍵詞特征分片集合的Bloom Filte(布隆過濾器)構(gòu)造,以及原始關(guān)鍵詞集合線性表構(gòu)造,所述關(guān)鍵詞匹配階段包括:依據(jù)Bloom Filter實現(xiàn)當前窗口中文本串不與任何關(guān)鍵詞特征分片匹配的快速判定;只在判定失敗情況下通過字符串比較操作實現(xiàn)與候選關(guān)鍵詞的精確匹配;將文本匹配窗口連續(xù)多字節(jié)快速跳躍。本發(fā)明充分利用了待匹配文本與關(guān)鍵詞匹配成功概率異常低的特點,可實現(xiàn)大數(shù)量關(guān)鍵詞場景下的高速匹配,非常適合病毒檢測等在線病毒掃描應用。
- 專利類型發(fā)明專利
- 申請人北京啟明星辰信息技術(shù)股份有限公司;
- 發(fā)明人葉潤國;華東明;李博;胡振宇;
- 地址100094 北京市海淀區(qū)東北旺西路8號中關(guān)村軟件園21號啟明星辰大廈
- 申請?zhí)?/b>CN200710119845.2
- 申請時間2007年08月01日
- 申請公布號CN101359325B
- 申請公布時間2010年06月16日
- 分類號G06F17/30(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

