摘要:本發(fā)明公開了一種基于頁面分塊的圖片摘要提取系統(tǒng),包括頁面預(yù)處理模塊、頁面分類模塊、頁面分塊模塊、主題塊識(shí)別模塊和信息提取模塊。本發(fā)明還公開了一種基于頁面分塊的圖片摘要提取方法,具體包括:步驟S1、從Internet上把頁面抓取下來;步驟S2、頁面預(yù)處理模塊對(duì)頁面進(jìn)行預(yù)處理;步驟S3、頁面分類模塊對(duì)預(yù)處理后的頁面分類;步驟S4、頁面分塊模塊進(jìn)行語義塊劃分;步驟S5、頁面分塊模塊將主題型頁面發(fā)送到主題塊識(shí)別模塊,主題塊識(shí)別模塊識(shí)別出主題塊,并發(fā)送給信息提取模塊;頁面分塊模塊將非主題型頁面發(fā)送到信息提取模塊;步驟S6、信息提取模塊下載圖片并與頁面關(guān)聯(lián)。本發(fā)明具有提取速度快、準(zhǔn)確度高、效果好的優(yōu)點(diǎn)。
- 專利類型發(fā)明專利
- 申請(qǐng)人華南理工大學(xué);廣州數(shù)園網(wǎng)絡(luò)有限公司;
- 發(fā)明人董守斌;張朝斌;張凌;李粵;袁華;
- 地址510640 廣東省廣州市天河區(qū)五山路381號(hào)
- 申請(qǐng)?zhí)?/b>CN201010275844.9
- 申請(qǐng)時(shí)間2010年09月06日
- 申請(qǐng)公布號(hào)CN101944109A
- 申請(qǐng)公布時(shí)間2011年01月12日
- 分類號(hào)G06F17/30(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號(hào)

