摘要:本發(fā)明涉及一種版式文件中表格識別方法及系統(tǒng),屬于計(jì)算機(jī)信息處理領(lǐng)域的模式識別技術(shù)領(lǐng)域。現(xiàn)有的模式識別技術(shù)不能夠有效識別和自動提取版面中的表格。本發(fā)明所述的方法及系統(tǒng)首先利用自動合并技術(shù)將版面中獨(dú)立的文字進(jìn)行合并,使其組織成為內(nèi)容塊,然后再根據(jù)這些內(nèi)容塊的空間位置、字體信息、排版信息進(jìn)行表格的識別和內(nèi)容的組合。采用本發(fā)明所述的方法及系統(tǒng),可以通過分析報(bào)紙版面上內(nèi)容的位置和排版信息,快速高效的識別表格,同時(shí)正確的組織表格內(nèi)容。
- 專利類型發(fā)明專利
- 申請人北大方正集團(tuán)有限公司;北京方正阿帕比技術(shù)有限公司;
- 發(fā)明人徐劍波;董寧;
- 地址100871 北京市海淀區(qū)成府路298號方正大廈
- 申請?zhí)?/b>CN200810224799.7
- 申請時(shí)間2008年12月26日
- 申請公布號CN101770446A
- 申請公布時(shí)間2010年07月07日
- 分類號G06F17/21(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

