-
公开(公告)号:CN112668316A
公开(公告)日:2021-04-16
申请号:CN202011290565.X
申请日:2020-11-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/258 , G06F40/205 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种word文档关键信息抽取方法,其包括:步骤一、获取源word文档,遍历word文档的段落,对于任一段落,判断段落是否具有模板样式属性,若具有模板样式属性,则进入步骤二,否则进入步骤三;步骤二、根据段落的模板样式属性获取段落信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入至输出文件一中所属信息类别对应的区域;步骤三、基于预设的神经网络模型识别段落的信息类别,并与预设的待抽取关键信息类别列表进行匹配,将段落抽取并输入所属信息类别对应的区域。本发明利用了word文档中的模板样式属性的信息,从而极大地提高了word文档抽取关键信息地效率。
-
公开(公告)号:CN110442421A
公开(公告)日:2019-11-12
申请号:CN201910578655.X
申请日:2019-06-28
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F9/455
Abstract: 本发明提出一种基于Kubernetes的通用服务转换方法和系统,包括:构建由多个节点构成的Kubernetes系统,其中节点的Pod设有用于提供服务的原服务容器,并通过在Pod中新添加容器的方式或通过原容器镜像的方式,在节点的Pod中加入转换程序;每当发生一次服务调用请求,转换容器或程序根据配置,将服务调用请求转换为原服务执行请求,通过调用原服务容器,提供相对应的服务,并转换成该服务调用请求所对应的服务结果。本发明可解决Kubernetes服务与调用者之间接口不一致的问题;并可减少转换程序与服务程序、调用程序之间的网络开销,同时结合Kubernetes特性,服务程序重新部署时,转换程序自动跟随部署。
-
公开(公告)号:CN110414680A
公开(公告)日:2019-11-05
申请号:CN201910667447.7
申请日:2019-07-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了基于众包标注的知识加工系统,包括:粗知识管理模块,其用于导入待标注知识;任务发布模块,其用于生成标注任务并发布,所述标注任务包括待标注知识、标注员、审核员和标注字段;知识标注模块,其用于对所述标注任务进行标注处理,并将已处理的标注任务生成审核任务;知识审核模块,其用于对所述审核任务对应的标注结果进行审核处理。本发明采用众包标注的形式进行知识加工,加工过程辅以机器学习进行自动抽取,通过人机结合的知识加工过程,形成有效的综合知识库。
-
公开(公告)号:CN110287314A
公开(公告)日:2019-09-27
申请号:CN201910418900.0
申请日:2019-05-20
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。
-
公开(公告)号:CN118551764A
公开(公告)日:2024-08-27
申请号:CN202411028372.5
申请日:2024-07-30
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F16/35 , G06F16/33 , G06F18/24 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种针对非连续实体的实体关系联合抽取方法及装置。该方法属于信息抽取和自然语言处理技术领域,包括:利用实体关系抽取模型预测待处理文本中每两个字符间的关系;对实体关系抽取模型的训练,首先将训练文本中的每两个字符作为字符组合存储在表格中,并对表格中的字符组合进行字符间关系的标注;利用该模型中的空洞卷积层和联合分类器对字符组合进行字符间关系标签的预测;基于真实标签信息和预测标签信息计算损失来训练该模型。本发明提供的针对非连续实体的实体关系联合抽取方法及装置,利用空洞卷积和联合分类器对字符组合构成的表格进行标签预测,实现了对非连续实体关系的联合抽取,提高了模型在复杂场景的适应能力。
-
公开(公告)号:CN118471545B
公开(公告)日:2024-11-19
申请号:CN202410927599.7
申请日:2024-07-11
Applicant: 中国科学院自动化研究所
IPC: G16H50/80 , G16H50/70 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/084 , G06F18/213 , G06F18/25 , G06N3/0442
Abstract: 本发明提供一种基于数据解耦的传染病传播预测方法、装置及电子设备,涉及医疗保健信息学技术领域,方法包括:获取待预测传染病数据并进行编码,得到传染病编码数据;对传染病编码数据进行数据解耦,分别得到风险外溢信号数据和本地演变信号数据;通过图卷积神经网络对风险外溢信号数据进行特征提取,得到风险外溢特征,并通过长短期记忆网络对本地演变信号数据进行特征提取,得到本地演变特征;将风险外溢特征与本地演变特征进行特征融合,得到传染病数据融合特征,并通过多层感知机对传染病数据融合特征进行预测得到传播预测结果。通过本申请,在预测时结合传染病传播性质和演变规律,来提取特征进行传染病传播预测,提高了预测准确性。
-
公开(公告)号:CN118471545A
公开(公告)日:2024-08-09
申请号:CN202410927599.7
申请日:2024-07-11
Applicant: 中国科学院自动化研究所
IPC: G16H50/80 , G16H50/70 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/084 , G06F18/213 , G06F18/25 , G06N3/0442
Abstract: 本发明提供一种基于数据解耦的传染病传播预测方法、装置及电子设备,涉及医疗保健信息学技术领域,方法包括:获取待预测传染病数据并进行编码,得到传染病编码数据;对传染病编码数据进行数据解耦,分别得到风险外溢信号数据和本地演变信号数据;通过图卷积神经网络对风险外溢信号数据进行特征提取,得到风险外溢特征,并通过长短期记忆网络对本地演变信号数据进行特征提取,得到本地演变特征;将风险外溢特征与本地演变特征进行特征融合,得到传染病数据融合特征,并通过多层感知机对传染病数据融合特征进行预测得到传播预测结果。通过本申请,在预测时结合传染病传播性质和演变规律,来提取特征进行传染病传播预测,提高了预测准确性。
-
-
-
-
-
-