-
公开(公告)号:CN104239282B
公开(公告)日:2017-11-14
申请号:CN201410455662.8
申请日:2014-09-09
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种电子书的处理方法和装置。所述处理方法包括:获取电子书多个页面的页面内容数据;从所述页面内容数据识别文字行块和图,其中,每个文字行块包括单个文字行或具有相同属性的连续的文字行;基于识别出的图和文字行块确定图注识别特征;根据确定的图注识别特征为识别出的图标注图注。如此,能够自动完成图与图注的关联识别,优化图文类电子书的线上展示,能够保障其在线上重排版展示时不会出现格式错乱,并提高数据处理效率,减少人工编辑的成本,以及提高图注识别的准确率。
-
公开(公告)号:CN103488619A
公开(公告)日:2014-01-01
申请号:CN201310282405.4
申请日:2013-07-05
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 徐广金
IPC: G06F17/24
Abstract: 本发明公开了一种用于进行文档文件处理的方法及装置。其中用于进行文档文件处理的方法包括:从文档文件中提取文档文件元素;根据所述文档文件元素的类型与文档文件元素在该文档文件中的位置信息来对所述文档文件元素进行合并,以生成合并后的文档文件。本发明通过根据从文档文件中提取的文档文件元素的类型,与该文档文件元素在文档文件中的位置信息,来对文档文件元素进行合并,生成合并后的文档文件,不需要人工参与分别对每篇文档文件进行编辑,就可以生成自适应用户设备的屏幕的文档文件。
-
公开(公告)号:CN103488619B
公开(公告)日:2017-05-24
申请号:CN201310282405.4
申请日:2013-07-05
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 徐广金
IPC: G06F17/24
Abstract: 本发明公开了一种用于进行文档文件处理的方法及装置。其中用于进行文档文件处理的方法包括:从文档文件中提取文档文件元素;根据所述文档文件元素的类型与文档文件元素在该文档文件中的位置信息来对所述文档文件元素进行合并,以生成合并后的文档文件。本发明通过根据从文档文件中提取的文档文件元素的类型,与该文档文件元素在文档文件中的位置信息,来对文档文件元素进行合并,生成合并后的文档文件,不需要人工参与分别对每篇文档文件进行编辑,就可以生成自适应用户设备的屏幕的文档文件。
-
公开(公告)号:CN104239282A
公开(公告)日:2014-12-24
申请号:CN201410455662.8
申请日:2014-09-09
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种电子书的处理方法和装置。所述处理方法包括:获取电子书多个页面的页面内容数据;从所述页面内容数据识别文字行块和图,其中,每个文字行块包括单个文字行或具有相同属性的连续的文字行;基于识别出的图和文字行块确定图注识别特征;根据确定的图注识别特征为识别出的图标注图注。如此,能够自动完成图与图注的关联识别,优化图文类电子书的线上展示,能够保障其在线上重排版展示时不会出现格式错乱,并提高数据处理效率,减少人工编辑的成本,以及提高图注识别的准确率。
-
-
-