-
公开(公告)号:CN104462045B
公开(公告)日:2017-11-03
申请号:CN201410778704.1
申请日:2014-12-15
Applicant: 北京信息科技大学
Abstract: 本发明提供一种文档处理方法和装置。所述文档处理方法,包括:获取文档内容;获取所述文档内容对应的至少一种文档式样ID;从所述至少一种文档式样ID中,选择第一文档式样ID;从文档式样库中,获取所述第一文档式样ID对应的第一文档式样;以所述第一文档式样定义的文档式样,显示所述文档内容。本发明中用户仅需编辑内容,可省去大量繁重的式样设置工作,方便了用户的编辑工作,保证式样的规范性,减少存储空间和网络传输的资源消耗。
-
公开(公告)号:CN106776495A
公开(公告)日:2017-05-31
申请号:CN201611034443.8
申请日:2016-11-23
Applicant: 北京信息科技大学
Abstract: 本发明实施例提供一种文档逻辑结构重建方法,包括:步骤1、提取源文档的分段,并识别出每一段落的类型;具体包括:步骤11、获取每一段落的特征向量M=[m1 m2 ... mn];其中向量M具有n个分量:m1、m2……mn;其中每个分量表示一种格式信息,所述格式信息为以下的至少一种:字体大小、字型、大纲级别、行距、是否加黑、是否粗体、是否斜体;步骤12、利用预设的向量模板集合,对所述每一段落的向量进行匹配,以确定每一段落的角色;其中预设的向量模板集合中包含多个预定义的向量,且每一向量对应一种特定的角色类型;步骤2、根据源文档的每一段落的角色类型,构建出源文档的逻辑模型。
-
公开(公告)号:CN105975597A
公开(公告)日:2016-09-28
申请号:CN201610304528.7
申请日:2016-05-10
Applicant: 北京信息科技大学
IPC: G06F17/30
CPC classification number: G06F17/30 , G06F17/30796 , G06F17/30705 , G06F17/30743
Abstract: 本发明涉及一种东巴经典古籍传承体系数字化国际共享平台,其包括收藏机构、东巴经典古籍象形文释读库、世界记忆工程数据库、管理平台模块和信息传播模块;收藏机构将收藏到的各种东巴经典古籍信息传输至东巴经典古籍象形文释读库,东巴经典古籍象形文释读库与世界记忆工程数据库进行信息交互;东巴经典古籍象形文释读库由管理平台模块进行登录与身份管理、使用权限管理、存储管理、安全管理、查询管理;东巴经典古籍象形文释读库将处理后的东巴象形文字经信息传播模块传输至外界。本发明能使更多人群看到和使用世界各地收藏的东巴经典,能够为世界范围系统研究东巴经典提供资源及条件。同时,有利于东巴经典古籍的抢救、保护与传承。
-
公开(公告)号:CN103079259B
公开(公告)日:2015-11-11
申请号:CN201210538002.7
申请日:2012-12-13
IPC: H04W48/18
Abstract: 本发明公开了一种移动机会网络中网关选择方法,步骤是:计算相遇频率:由一个控制节点集中计算网络中每个节点同其他节点间平均相遇频率;基于中心度的候选网关选择:依次选择K个中心度最大的节点为候选网关;基于频繁轨迹的候选网关选择:对所有K个节点组合确定其对应的广播频繁轨迹,选择对应期望时延最低的为候选网关;基于蒙特卡洛模拟的网关选择:对基于中心度所得的候选网关、基于频繁轨迹所得的候选网关,利用蒙特卡洛模拟评估从它们开始的期望广播时延,选择时延更短的为最终所选的K个网关。跟传统移动无线网络中固定网关节点选择不同,本发明考虑了机会传输模式下的移动网关选择。移动网关的引入,可降低传统蜂窝接入网络的负载。本发明基于节点社会属性进行移动网关选择,可达到优化从网关出发数据传输速度的目标。
-
公开(公告)号:CN102622334A
公开(公告)日:2012-08-01
申请号:CN201210119271.X
申请日:2012-04-20
IPC: G06F17/22
Abstract: 随着XML文档的规模越来越大,结构越来越复杂,XSLT的转换性能问题则成了限制其继续发展的一个重要问题。本发明提供的并行XSLT转换方法及装置通过将XSLT文件划分为多个转换模块,利用多线程环境来进行并行XSLT转换来提高转换效率。本发明通过对XSLT文件本身以及各转换模块对训练数据的转换情况的分析,可以实现XSLT文件的自动化并行划分,避免了人工划分的不足;并且,划分得到的各个转换模块数量优化、转换代价均衡,可以在多线程环境下有效地提高对源文档进行XSLT转换的性能和效率。
-
公开(公告)号:CN101615174A
公开(公告)日:2009-12-30
申请号:CN200810115473.0
申请日:2008-06-24
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种基于XML的不同格式文档的转换方法,包括:步骤1.将待转换文档中欲保护的节点内容替换成与所述节点内容对应的唯一标识符;步骤2.将经过步骤1之后的文档,由格式转换服务提供方转换成目标格式;步骤3.将转换成目标格式之后的所述文档中的唯一标识符,还原成对应的所述欲保护的节点内容。本发明提供的方法,在将待转换文档进行转换时,该文档的欲保护的内容信息不会被暴露,可以保证文档转换的安全性;并且由于进行文档转换时,不需要传输数据内容,大大降低了数据传送量,减少了数据传输流量开销。
-
公开(公告)号:CN119961692A
公开(公告)日:2025-05-09
申请号:CN202510042928.4
申请日:2025-01-10
Applicant: 北京信息科技大学
IPC: G06F18/22 , G06N5/022 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/0455 , G06N3/047
Abstract: 本发明公开了一种装备知识图谱多维度特征融合实例对齐方法,包括以下步骤:步骤S1,构建对偶图,初始化实例嵌入矩阵、关系嵌入矩阵和属性嵌入矩阵;步骤S2,利用图卷积神经网络学习关系感知实例嵌入,生成第一层实例嵌入优化矩阵;步骤S3,通过图卷积神经网络编码实例的邻居结构和属性信息,得到第二层实例嵌入优化矩阵;步骤S4,构建多头注意力机制的编码器,得到最终实例嵌入矩阵和关系嵌入矩阵;步骤S5,基于属性参与的多维自适应卷积解码器,确定最终的实例对齐结果。本发明利用对偶图卷积神经网络和多头注意力机制,对偶图和原始图的交互学习,结合带有高速公路网络的图卷积网络进行编码,提高实例对齐的精准度。
-
公开(公告)号:CN116663545A
公开(公告)日:2023-08-29
申请号:CN202310315234.4
申请日:2023-03-28
Applicant: 北京信息科技大学
IPC: G06F40/289 , G06F40/126 , G06N3/08 , G06N3/084 , G06F16/36 , G06F40/295 , G06F16/35 , G06N3/04
Abstract: 本公开提供了一种事件抽取方法及装置,该方法首先依据小样本数据对通用信息抽取模型进行微调,然后将生语料数据输入微调后的通用信息抽取模型进行预测,得到新增样本数据,之后将小样本数据和新增样本数据作为训练数据对ERNIE模型进行训练,依据训练好的ERNIE模型对目标文本进行编码,得到相应的特征向量,最后依据Global Pointer模型对特征向量进行解码,得到事件元素,该方法基于UIE、ERNIE和Global Pointer进行事件元素的抽取,可以针对领域事件抽取标注数据样本较少的问题,通过自动化的方式对训练样本进行扩充,将准确率、召回率和F1作为评价指标,提高了事件识别任务上和论元识别任务上的F1值,能有效提升小样本下的抽取性能,并且还解决了论元重叠的问题。
-
公开(公告)号:CN116108855A
公开(公告)日:2023-05-12
申请号:CN202310060570.9
申请日:2023-01-17
Applicant: 北京信息科技大学
IPC: G06F40/30 , G06F40/151
Abstract: 本公开的实施例公开了语义版式文档生成方法和装置。该方法的一具体实施方式包括:将以语义标注的形式在目标流式文档中所添加的文档语义元数据信息存储为语义标注记录;将目标流式文档和语义标注记录进行对应存储,得到语义流式文档;响应于检测到针对语义流式文档的第一文档格式转换操作,将语义内容写入目标版式语义元数据文件,其中,目标版式语义元数据文件存为预先定义的版式语义标注记录格式;将语义流式文档所包括的目标流式文档转换为目标版式文档;将目标版式语义元数据文件和目标版式文档进行融合,以生成目标版式的语义文档,作为语义版式文档。该实施方式可以准确、便捷地生成语义版式文档。
-
公开(公告)号:CN111611776A
公开(公告)日:2020-09-01
申请号:CN202010442133.X
申请日:2020-05-22
Applicant: 北京信息科技大学 , 北京新云胜科技有限公司 , 中国电子技术标准化研究院 , 北京安信天元科技发展有限公司 , 百望股份有限公司 , 北京方正阿帕比技术有限公司 , 北京大学 , 北京数科网维技术有限责任公司 , 福建福昕软件开发股份有限公司 , 福昕鲲鹏(北京)信息科技有限公司 , 方正国际软件(北京)有限公司
IPC: G06F40/149 , G06F40/186
Abstract: 本公开的实施例公开了兼容版流文档内容并支持同步阅读的方法和装置。该方法的一具体实施方式包括:获取用户针对目标文档的阅读方式信息,其中,目标文档包括文档正文和附加信息,附加信息存储在附加信息区域中;将目标文档存储为版流一体的文档记录结构;版流一体的文档记录结构保存版式文档、流式格式内容框架、关联记录和附加信息;根据阅读方式信息,解析并显示目标文档;响应于用户更新附加信息,更新并存储附加信息区域中的附加信息。这种方法实现了满足不同阅读方式要求的文档处理方法,同时提供了支持该文档处理方法的同步阅读装置,提供给用户良好的阅读体验。文档处理完毕后,文档正文无变化,仅更新附加信息,节省存储空间。
-
-
-
-
-
-
-
-
-