摘要:本發(fā)明涉及一種基于語義分析的EXCEL文檔中身份信息的識(shí)別方法,其步驟包括:1)構(gòu)造最大熵模型,采用特征函數(shù)表示該最大熵模型的約束條件,并通過在訓(xùn)練集上進(jìn)行學(xué)習(xí)得到特征函數(shù)的權(quán)值;2)創(chuàng)建處理的類對(duì)象,將需要處理的Excel文件名傳遞到類對(duì)象中;3)應(yīng)用所述最大熵模型對(duì)需要處理的Excel文件進(jìn)行信息抽取,將獲得的具體內(nèi)容在類對(duì)象中緩存,進(jìn)而從類對(duì)象中輸出識(shí)別結(jié)果。本發(fā)明能夠節(jié)省人工分析特定信息成本,并能減少人工分析的誤差,提高身份信息數(shù)據(jù)的識(shí)別和抽取的準(zhǔn)確率。
- 專利類型發(fā)明專利
- 申請(qǐng)人北京銳安科技有限公司;
- 發(fā)明人李核;
- 地址100044 北京市海淀區(qū)中關(guān)村南大街乙56號(hào)方圓大廈9層
- 申請(qǐng)?zhí)?/b>CN201310751514.6
- 申請(qǐng)時(shí)間2013年12月31日
- 申請(qǐng)公布號(hào)CN103744830A
- 申請(qǐng)公布時(shí)間2014年04月23日
- 分類號(hào)G06F17/22(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號(hào)

