摘要:本發(fā)明提供了一種版式文檔中復(fù)合圖的提取裝置,包括:文檔解析單元,對版式文檔進(jìn)行解析,確定構(gòu)成所述版式文檔的圖元及所述圖元的類型;圖層生成單元,提取文字圖元以構(gòu)成文字圖層,并利用其余的非文字圖元構(gòu)成非文字圖層;版面分析單元,分別對文字圖層和非文字圖層進(jìn)行版面分析處理;區(qū)塊生成單元,生成文字圖層中的文字區(qū)塊和非文字圖層中的圖像區(qū)塊;關(guān)聯(lián)區(qū)塊確定單元,確定與每個圖像區(qū)塊相關(guān)聯(lián)的文字區(qū)塊,以合并為復(fù)合圖區(qū)塊;標(biāo)識存儲單元,存儲復(fù)合圖區(qū)塊包含的所有圖元的標(biāo)識。本發(fā)明還提出了一種版式文檔中復(fù)合圖的提取方法。通過本發(fā)明的技術(shù)方案,可以在復(fù)雜的文檔版面布局中,尤其是圖文混排版面中,實現(xiàn)對復(fù)合圖的準(zhǔn)確提取。
- 專利類型發(fā)明專利
- 申請人北大方正集團有限公司;北京方正阿帕比技術(shù)有限公司;北京大學(xué);
- 發(fā)明人許燦輝;湯幟;陶欣;史操;
- 地址100871 北京市海淀區(qū)成府路298號方正大廈9層
- 申請?zhí)?/b>CN201310343908.8
- 申請時間2013年08月08日
- 申請公布號CN104346615A
- 申請公布時間2015年02月11日
- 分類號G06K9/46(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

