摘要:本發(fā)明提供一種多語文檔分離的方法和系統(tǒng),其主要原理是:對文檔字符進(jìn)行掃描;提取當(dāng)前掃描字符的字符屬性信息;并根據(jù)字符屬性信息與語種標(biāo)識間的映射關(guān)系,為當(dāng)前掃描字符分配相應(yīng)語種標(biāo)識;將當(dāng)前掃描字符的語種標(biāo)識與需分離語種標(biāo)識進(jìn)行比較,并當(dāng)二者相同時,記錄當(dāng)前掃描字符為句首字符;將掃描到的下一個字符與句尾符號進(jìn)行比較,并當(dāng)二者相同時,記錄其為句尾字符;將自句首字符至句尾字符的所有字符定位為當(dāng)前句,并為當(dāng)前句分配存放指針;根據(jù)所述存放指針,將當(dāng)前句寫入到與該語種標(biāo)識對應(yīng)的文件中。通過本發(fā)明,能夠?qū)崿F(xiàn)對WORD文檔中的多語混雜內(nèi)容進(jìn)行分離,不僅方便了用戶操作,而且能夠大大節(jié)約人力資源和時間。
- 專利類型發(fā)明專利
- 申請人傳神聯(lián)合(北京)信息技術(shù)有限公司;
- 發(fā)明人趙國偉;
- 地址100086 北京市海淀區(qū)青云里滿庭芳園小區(qū)9號樓青云當(dāng)代大廈十七層1707A1房間
- 申請?zhí)?/b>CN201010285962.8
- 申請時間2010年09月19日
- 申請公布號CN101996164B
- 申請公布時間2012年07月04日
- 分類號G06F17/22(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

