摘要:本發(fā)明公開(kāi)了一種處理掃描書(shū)數(shù)據(jù)的方法及裝置,為實(shí)現(xiàn)對(duì)掃描書(shū)的頁(yè)面文檔進(jìn)行版面重排提供必要條件,從而能夠?qū)崿F(xiàn)對(duì)掃描書(shū)進(jìn)行版面重排。方法包括:讀取所述頁(yè)面文檔的頁(yè)面圖像數(shù)據(jù);對(duì)所述頁(yè)面圖像數(shù)據(jù)進(jìn)行分割、識(shí)別,得到所述頁(yè)面文檔中的每個(gè)文字在相應(yīng)頁(yè)面文檔上的矩形框位置和字符編碼;對(duì)所述頁(yè)面文檔中的每行文字進(jìn)行文字行聚合處理,得到所述每行文字的文字行信息,并根據(jù)所述文字行信息對(duì)所述每行文字中的每個(gè)文字對(duì)應(yīng)的矩形框進(jìn)行修正,得到每個(gè)文字的確切圖像矩形框位置信息和文字行聚合信息;存儲(chǔ)所述頁(yè)面文檔中每個(gè)文字對(duì)應(yīng)的確切圖像矩形框位置信息、文字行聚合信息和字符編碼。
- 專利類型發(fā)明專利
- 申請(qǐng)人北大方正集團(tuán)有限公司;北京方正阿帕比技術(shù)有限公司;
- 發(fā)明人仇睿恒;李赟;
- 地址100871 北京市海淀區(qū)成府路298號(hào)方正大廈9層
- 申請(qǐng)?zhí)?/b>CN201110448225.X
- 申請(qǐng)時(shí)間2011年12月28日
- 申請(qǐng)公布號(hào)CN103186911A
- 申請(qǐng)公布時(shí)間2013年07月03日
- 分類號(hào)G06T11/60(2006.01)I;G06K9/20(2006.01)I;




教育裝備采購(gòu)網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號(hào)

