电子文件的实时输出方法和装置

    公开(公告)号:CN113703699B

    公开(公告)日:2023-05-05

    申请号:CN202111185218.5

    申请日:2021-10-12

    Abstract: 本公开的实施例公开了电子文件的实时输出方法和装置。该方法的一具体实施方式包括:获取打印参数集合和目标电子文件,其中,打印参数集合为目标电子文件对应的打印相关限定参数集合;从打印参数中解析出打印对象集合;从目标电子文件中解析出页面数据集合;根据打印对象集合和页面数据集合实时打印输出目标电子文件。该实施方式能够同步展示电子文件中的动态内容变化情况,实现电子文档的可视化预览排版,同时实时打印电子文件中的动态内容,提高电子文件输出效率,减少了电子文件输出的资源消耗。

    一种XML数据处理方法、系统和存储介质

    公开(公告)号:CN111125439A

    公开(公告)日:2020-05-08

    申请号:CN201911241767.2

    申请日:2019-12-06

    Abstract: 本发明公开了一种XML数据处理方法、系统和存储介质,该方法包括:在读入XML数据过程中将XML数据中的每个XML元素节点绑定一个节点标识,其中,节点标识是整数编码值;将节点标识与预设列表相关联,其中,预设列表包括节点标识的名称表、节点标识的子节点标识列表、节点标识的节点文本列表和节点标识的属性列表;根据节点标识和预设列表构建以节点标识及其兄弟节点的索引值为参数入口的XML数据处理接口集;根据XML数据处理接口集封装用户的相关操作,其中,相关操作至少包括定位元素节点、添加元素节点、删除元素节点、给元素节点赋值和/或导出保存XML数据。通过本发明解决了现有技术缺陷造成的处理效率低下的问题。

    生成目录结构化信息的方法和装置

    公开(公告)号:CN110705503A

    公开(公告)日:2020-01-17

    申请号:CN201910973998.6

    申请日:2019-10-14

    Abstract: 本公开的实施例公开了生成目录结构化信息的方法和装置。该方法的一具体实施方式包括:获取待处理版式文档,待处理版式文档包括目录;基于目录的目录特征信息,对目录进行识别,得到版式目录信息;对版式目录信息依次进行去噪、分栏、成行分段、去重处理,得到处理后的版式目录信息;将处理后的版式目录信息映射为目录结构化信息。该实施方式增强了目录在不同设备上显示的自适应性。

    一种新闻话题检测方法
    4.
    发明公开

    公开(公告)号:CN110134787A

    公开(公告)日:2019-08-16

    申请号:CN201910400320.9

    申请日:2019-05-15

    Abstract: 本发明涉及一种新闻话题检测方法包括:步骤1)对新闻语料集进行预处理,对文本信息进行关键词抽取;步骤2)采用抽取出的关键词集,通过聚类的方法,计算新闻报道与话题类簇之间的相似度,得到关键词类簇,选出具有代表性的关键词作为报道事件的关键词。本发明提供的新闻话题检测方法,提出了改进的相似度计算方法,采用抽取出的关键词集,通过聚类的方法,动态地调整新闻报道与话题的相似度,得到关键词类簇,选出具有代表性的关键词作为报道事件的关键词,用来完成新闻话题的检测,能够对新闻报道中的信息进行准确抽取,能够准确地自动检测新闻报道话题,使得话题能够自动更新并动态演化,检测效果好,可以很好地满足实际应用的需要。

    一种办公文档排版式样的测试方法及装置

    公开(公告)号:CN110109838A

    公开(公告)日:2019-08-09

    申请号:CN201910381064.3

    申请日:2019-05-08

    Abstract: 本发明公开一种办公文档排版式样的测试方法及装置,该方法包括:根据被测第一文档中的排版式样信息,修改每个版面元素对应的颜色值,生成第二文档;将所述第一文档和第二文档分别通过被测办公软件打开,并分别转换为第一PDF文档和第二PDF文档;根据所述第一PDF文档和第二PDF文档的各自版面效果,获得对应的第一图像和第二图像;在所述第二图像中,根据排版式样信息,识别版面元素,得到元素集合;将所述第一图像和所述元素集合进行排版式样测量。该方法可通过自动化地识别版面元素类型,并对被测文档的排版式样进行精确的比对,从而提高文档排版式样的测试效率,降低人工成本。

    文档生成方法和装置
    6.
    发明公开

    公开(公告)号:CN107423271A

    公开(公告)日:2017-12-01

    申请号:CN201710647290.2

    申请日:2017-08-01

    Inventor: 李宁 田英爱 刘倩

    Abstract: 本申请实施例公开了文档生成方法和装置。该方法的一具体实施方式包括:获取包括至少两个文档组成单元的初始流式文档,确定指示每一个文档组成单元的用于标注的元数据;根据所确定的元数据的语义,将所确定的元数据进行基于可扩展置标语言的结构化处理,生成标记有标记信息的可扩展置标语言架构文档;获取带有注释性标记的初始流式文档,将带有注释性标记的初始流式文档确定为注释性流式文档;建立可扩展置标语言架构文档中标记的标记信息和该注释性流式文档所标记的标记信息的映射关系;基于该映射关系,将该注释性流式文档转换为可扩展置标语言文档。生成了标注有标注信息的可扩展置标语言文档,便于计算机更加深入地理解文档。

    一种东巴象形文字识别方法

    公开(公告)号:CN104794455A

    公开(公告)日:2015-07-22

    申请号:CN201510220780.5

    申请日:2015-05-04

    Abstract: 本发明涉及一种东巴象形文字识别方法,其包括步骤:采用投影法对东巴象形文字进行特征提取;根据提取的东巴象形文字特征,结合相似法和网络反馈法对东巴象形文字进行识别,针对于结构笔画简单,形态结构各异且很容易辨识的东巴象形文字采用相似法进行识别;对于结构笔画复杂,形态结构类似的东巴象形文字采用网络反馈方法进行识别。本发明可以将东巴文分类到较小的范围,达到较高的识别率,并且减少识别时间,可以广泛在文字识别领域中应用。

    一种基于节点社会属性的移动机会网络网关选择方法

    公开(公告)号:CN103079259A

    公开(公告)日:2013-05-01

    申请号:CN201210538002.7

    申请日:2012-12-13

    Abstract: 本发明公开了一种移动机会网络中网关选择方法,步骤是:计算相遇频率:由一个控制节点集中计算网络中每个节点同其他节点间平均相遇频率;基于中心度的候选网关选择:依次选择K个中心度最大的节点为候选网关;基于频繁轨迹的候选网关选择:对所有K个节点组合确定其对应的广播频繁轨迹,选择对应期望时延最低的为候选网关;基于蒙特卡洛模拟的网关选择:对基于中心度所得的候选网关、基于频繁轨迹所得的候选网关,利用蒙特卡洛模拟评估从它们开始的期望广播时延,选择时延更短的为最终所选的K个网关。跟传统移动无线网络中固定网关节点选择不同,本发明考虑了机会传输模式下的移动网关选择。移动网关的引入,可降低传统蜂窝接入网络的负载。本发明基于节点社会属性进行移动网关选择,可达到优化从网关出发数据传输速度的目标。

    语义文档存储方法、装置

    公开(公告)号:CN114707514A

    公开(公告)日:2022-07-05

    申请号:CN202210312822.8

    申请日:2022-03-28

    Abstract: 本公开的实施例公开了语义文档存储方法、装置。该方法的一具体实施方式包括:响应于接收到针对已嵌入语义标记的语义文档的语义标记转换指令,对已嵌入语义标记的语义文档进行语义标记预处理,得到预处理后的流式文档;对预处理后的流式文档进行文本编辑,得到编辑后流式文档;响应于接收到针对编辑后流式文档的语义批注转换指令,对编辑后流式文档进行语义批注后处理,得到处理后的语义文档;对处理后的语义文档进行存储。该实施方式可以使得文字处理软件正常打开、编辑且保存嵌入语义标记的语义文档,同时使得嵌入语义标记的语义文档便于文档的高效检索、信息提取及机器理解等智能化处理。

Patent Agency Ranking