摘要:本發(fā)明公開了一種文本分詞方法及系統(tǒng),所述方法包括:預(yù)先建立與待處理文本相對應(yīng)的綁定詞典,并綁定所述文本和所述綁定詞典,所述綁定詞典中的詞包括所述文本中未收錄在通用詞典中的未登錄詞;將所述文本與所述通用詞典中的詞進(jìn)行匹配,得到準(zhǔn)分詞結(jié)果;根據(jù)所述綁定詞典中的詞對所述準(zhǔn)分詞結(jié)果進(jìn)行修正。采用本發(fā)明所述的文本分詞方法及系統(tǒng),通過增加綁定詞典,為實現(xiàn)給不同的文本定制相應(yīng)的詞典資源提供了很大的自由度,在不需要修改通用詞典情況下,實現(xiàn)文本分析結(jié)果的優(yōu)化。
- 專利類型發(fā)明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發(fā)明人葉琿;王培養(yǎng);郜靜文;高毅;于振華;趙志偉;
- 地址230088 安徽省合肥市高新開發(fā)區(qū)望江西路666號
- 申請?zhí)?/b>CN201410153908.6
- 申請時間2014年04月16日
- 申請公布號CN103942190A
- 申請公布時間2014年07月23日
- 分類號G06F17/27(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

