摘要:本發(fā)明公開了一種基于結(jié)構(gòu)概要的數(shù)據(jù)恢復(fù)方法,包括:分析XML文檔樹數(shù)據(jù),計(jì)算XML文檔樹葉節(jié)點(diǎn)對(duì)應(yīng)的數(shù)據(jù)信息,并將所述葉節(jié)點(diǎn)數(shù)據(jù)信息進(jìn)行存儲(chǔ)和索引;將XPath查詢語句解析成Twig模式樹,分解模式樹拆分的簡(jiǎn)單路徑,并標(biāo)注感興趣的模式節(jié)點(diǎn)集;記錄感興趣的模式節(jié)點(diǎn)序列集,并進(jìn)行模式節(jié)點(diǎn)序列的合并;根據(jù)記錄的感興趣的模式節(jié)點(diǎn)序列集,恢復(fù)與感興趣的模式節(jié)點(diǎn)序列集相匹配的數(shù)據(jù)節(jié)點(diǎn)集。本發(fā)明利用XML數(shù)據(jù)結(jié)構(gòu)摘要信息和基于路徑的索引,在索引匹配與選取的過程中,恢復(fù)所需要的數(shù)據(jù)。從數(shù)據(jù)恢復(fù)范圍和數(shù)據(jù)恢復(fù)時(shí)機(jī)這兩方面對(duì)現(xiàn)有的方法進(jìn)行了改進(jìn),可以正確、高效、準(zhǔn)確地恢復(fù)所需要的數(shù)據(jù),避免現(xiàn)有方法不準(zhǔn)確,產(chǎn)生冗余等缺點(diǎn)。
- 專利類型發(fā)明專利
- 申請(qǐng)人同方知網(wǎng)(北京)技術(shù)有限公司;
- 發(fā)明人陳琳;陳海濤;夏冬;王奎;
- 地址100084 北京市海淀區(qū)清華園清華大學(xué)36區(qū)華業(yè)大廈B1410、1412、1414室
- 申請(qǐng)?zhí)?/b>CN201310100931.4
- 申請(qǐng)時(shí)間2013年03月27日
- 申請(qǐng)公布號(hào)CN103136378B
- 申請(qǐng)公布時(shí)間2016年04月20日
- 分類號(hào)G06F17/30(2006.01)I;




教育裝備采購(gòu)網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號(hào)

