-
公开(公告)号:CN110377690B
公开(公告)日:2021-03-16
申请号:CN201910566562.5
申请日:2019-06-27
Applicant: 北京信息科技大学
IPC: G06F16/31 , G06F16/36 , G06F16/958 , G06F40/211 , G06F40/216 , G06F40/295 , G06F40/30
Abstract: 本申请提供一种基于远程关系抽取的信息获取系统,该信息获取系统包括信息检索模块、情报获取模块和情报分析模块。本发明构建了面向web的行业领域信息获取框架,提出了借助知识融合、领域规则等方法,降低知识库“远程监督”标注数据时出现的“噪声”干扰问题;并借助因子图模型良好的性能,实现了情报感知过程中的实体关系自动抽取任务。上述框架和方法可有效应用于情报感知、数据分析和获取工作中,并具有领域移植性。
-
公开(公告)号:CN111738002A
公开(公告)日:2020-10-02
申请号:CN202010454177.4
申请日:2020-05-26
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于Lattice LSTM的古文领域命名实体识别方法、系统、电子设备及可读存储介质,其中,该方法包括:采用甲言分词对预训练古文数据进行分词;采用word2vec模型对分词后的预训练古文数据进行预训练得到预训练的字词向量;将数据集数据和所述预训练的字词向量输入至Lattice LSTM模型中进行训练,得到优化后的Lattice LSTM模型;将待识别古文数据输入至优化后的Lattice LSTM模型进行命名实体识别。该方法采用甲言(jiayan)分词工具进行古文数据的分词,分词效果较好且符合语境,提高了古文分词的准确性;利用word2vec训练古文字、词向量,通过大量的文本获得质量更高的字词向量;将字向量和词向量共同作为Lattice LSTM模型的输入,提升了古文领域数据实体识别的效果。
-
公开(公告)号:CN110413796A
公开(公告)日:2019-11-05
申请号:CN201910596452.3
申请日:2019-07-03
Applicant: 北京信息科技大学
Abstract: 本发明提供一种煤矿典型动力灾害领域本体构建方法。该方法融合了传统的骨架法和七步法,详细阐述了本体构建过程中所用的技术,为研究者提供了工程上可实现的本体构建思路。使用Jena工具实现本体的形式化表示,介绍了Jena工具的体系结构和构建所用的关键性代码。
-
公开(公告)号:CN106407168A
公开(公告)日:2017-02-15
申请号:CN201610803388.8
申请日:2016-09-06
Abstract: 本发明涉及一种应用文自动生成方法,包括以下步骤:步骤1)建立语料库;步骤2)选择多个适用实体并输入其对应的具体内容;步骤3)建立模板库并从中选择一个模板;步骤4)对所选择的模板进行润色。本发明提供的应用文自动生成方法,建立的语料库数据量大,适用实体的选择准确,自动生成的应用文中没有无关内容,应用于同一场合的应用文不会产生雷同,文章语言生动,基本不需要人再进行大的修改,可以很好地满足实际应用的需要。
-
公开(公告)号:CN119961692A
公开(公告)日:2025-05-09
申请号:CN202510042928.4
申请日:2025-01-10
Applicant: 北京信息科技大学
IPC: G06F18/22 , G06N5/022 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/0455 , G06N3/047
Abstract: 本发明公开了一种装备知识图谱多维度特征融合实例对齐方法,包括以下步骤:步骤S1,构建对偶图,初始化实例嵌入矩阵、关系嵌入矩阵和属性嵌入矩阵;步骤S2,利用图卷积神经网络学习关系感知实例嵌入,生成第一层实例嵌入优化矩阵;步骤S3,通过图卷积神经网络编码实例的邻居结构和属性信息,得到第二层实例嵌入优化矩阵;步骤S4,构建多头注意力机制的编码器,得到最终实例嵌入矩阵和关系嵌入矩阵;步骤S5,基于属性参与的多维自适应卷积解码器,确定最终的实例对齐结果。本发明利用对偶图卷积神经网络和多头注意力机制,对偶图和原始图的交互学习,结合带有高速公路网络的图卷积网络进行编码,提高实例对齐的精准度。
-
公开(公告)号:CN116663545A
公开(公告)日:2023-08-29
申请号:CN202310315234.4
申请日:2023-03-28
Applicant: 北京信息科技大学
IPC: G06F40/289 , G06F40/126 , G06N3/08 , G06N3/084 , G06F16/36 , G06F40/295 , G06F16/35 , G06N3/04
Abstract: 本公开提供了一种事件抽取方法及装置,该方法首先依据小样本数据对通用信息抽取模型进行微调,然后将生语料数据输入微调后的通用信息抽取模型进行预测,得到新增样本数据,之后将小样本数据和新增样本数据作为训练数据对ERNIE模型进行训练,依据训练好的ERNIE模型对目标文本进行编码,得到相应的特征向量,最后依据Global Pointer模型对特征向量进行解码,得到事件元素,该方法基于UIE、ERNIE和Global Pointer进行事件元素的抽取,可以针对领域事件抽取标注数据样本较少的问题,通过自动化的方式对训练样本进行扩充,将准确率、召回率和F1作为评价指标,提高了事件识别任务上和论元识别任务上的F1值,能有效提升小样本下的抽取性能,并且还解决了论元重叠的问题。
-
公开(公告)号:CN110413995B
公开(公告)日:2022-12-23
申请号:CN201910601361.4
申请日:2019-07-03
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06F16/28
Abstract: 本发明提供一种基于双向MGU神经网络的关系抽取方法。解决了单向MGU模型对后文依赖性不足,无法处理后文信息的问题。通过实验表明了该方法的训练时间更短,抽取准确率、召回率和F值更高。通过分析不同关系类型的抽取性能,发现了关系类型的选取以及语料特点对抽取性能存在一定影响。
-
公开(公告)号:CN114678075A
公开(公告)日:2022-06-28
申请号:CN202210302098.0
申请日:2022-03-24
Applicant: 北京信息科技大学
Abstract: 本公开提供一种基于分子结构信息获取分子表示数据的方法,包括:对于组成分子的各个原子,获取单个原子外层的各个电子轨道结构数据,并生成基于波函数表示的各个电子轨道结构数据,将波函数表示的各个电子轨道结构数据作为原子结构数据;在组成分子的单个原子的体素空间内,将基于波函数表示的各个电子轨道结构数据进行组合,形成基于波函数的原子卷积核;在组成分子的所有原子的整个体素空间内,对构成分子的各个原子,通过各个原子对应的基于波函数的原子卷积核进行卷积操作,分子的各个原子经对应的基于波函数的原子卷积核卷积操作后,生成基于体素的可视化分子表示数据。本公开还提供了一种分子属性获取方法。
-
公开(公告)号:CN112069889B
公开(公告)日:2021-08-03
申请号:CN202010759794.5
申请日:2020-07-31
Applicant: 北京信息科技大学
Abstract: 本公开提供了一种民航飞行器轨迹预测方法,其包括:S1、构建FTP‑GAN网络;S2、获取民航飞行器的轨迹数据,并对民航飞行器的轨迹数据进行归一化处理;其中,FTP‑GAN网络的生成器根据归一化后的轨迹数据生成民航飞行器的预测轨迹。
-
公开(公告)号:CN112579463A
公开(公告)日:2021-03-30
申请号:CN202011562073.1
申请日:2020-12-25
Applicant: 北京信息科技大学
IPC: G06F11/36
Abstract: 本发明公开了一种面向Solidity智能合约的缺陷预测方法,应用于软件缺陷预测技术领域,首先从Solidity源码中提取代码模块的度量元,并为每个代码模块标记缺陷数量,从而构建缺陷预测数据集;然后针对Solidity缺陷预测数据集中的类不平衡问题,采用过采样方法进行数据预处理;最后分别构建缺陷数量预测模型和缺陷倾向性预测模型,并评估模型的性能。本发明将度量元集与Solidity智能合约缺陷检测结果结合,构建了Solidity智能合约缺陷预测数据集,能够更好地描述Solidity智能合约的特征,基于以上数据集,分别验证了缺陷数量预测和缺陷倾向性预测问题中,不同模型的性能差异。
-
-
-
-
-
-
-
-
-