基于Lattice LSTM的古文领域命名实体识别方法和系统

    公开(公告)号:CN111738002A

    公开(公告)日:2020-10-02

    申请号:CN202010454177.4

    申请日:2020-05-26

    Abstract: 本发明公开了一种基于Lattice LSTM的古文领域命名实体识别方法、系统、电子设备及可读存储介质,其中,该方法包括:采用甲言分词对预训练古文数据进行分词;采用word2vec模型对分词后的预训练古文数据进行预训练得到预训练的字词向量;将数据集数据和所述预训练的字词向量输入至Lattice LSTM模型中进行训练,得到优化后的Lattice LSTM模型;将待识别古文数据输入至优化后的Lattice LSTM模型进行命名实体识别。该方法采用甲言(jiayan)分词工具进行古文数据的分词,分词效果较好且符合语境,提高了古文分词的准确性;利用word2vec训练古文字、词向量,通过大量的文本获得质量更高的字词向量;将字向量和词向量共同作为Lattice LSTM模型的输入,提升了古文领域数据实体识别的效果。

    一种应用文自动生成方法
    14.
    发明公开

    公开(公告)号:CN106407168A

    公开(公告)日:2017-02-15

    申请号:CN201610803388.8

    申请日:2016-09-06

    Abstract: 本发明涉及一种应用文自动生成方法,包括以下步骤:步骤1)建立语料库;步骤2)选择多个适用实体并输入其对应的具体内容;步骤3)建立模板库并从中选择一个模板;步骤4)对所选择的模板进行润色。本发明提供的应用文自动生成方法,建立的语料库数据量大,适用实体的选择准确,自动生成的应用文中没有无关内容,应用于同一场合的应用文不会产生雷同,文章语言生动,基本不需要人再进行大的修改,可以很好地满足实际应用的需要。

    一种装备知识图谱多维度特征融合实例对齐方法

    公开(公告)号:CN119961692A

    公开(公告)日:2025-05-09

    申请号:CN202510042928.4

    申请日:2025-01-10

    Abstract: 本发明公开了一种装备知识图谱多维度特征融合实例对齐方法,包括以下步骤:步骤S1,构建对偶图,初始化实例嵌入矩阵、关系嵌入矩阵和属性嵌入矩阵;步骤S2,利用图卷积神经网络学习关系感知实例嵌入,生成第一层实例嵌入优化矩阵;步骤S3,通过图卷积神经网络编码实例的邻居结构和属性信息,得到第二层实例嵌入优化矩阵;步骤S4,构建多头注意力机制的编码器,得到最终实例嵌入矩阵和关系嵌入矩阵;步骤S5,基于属性参与的多维自适应卷积解码器,确定最终的实例对齐结果。本发明利用对偶图卷积神经网络和多头注意力机制,对偶图和原始图的交互学习,结合带有高速公路网络的图卷积网络进行编码,提高实例对齐的精准度。

    事件抽取方法及装置
    16.
    发明公开

    公开(公告)号:CN116663545A

    公开(公告)日:2023-08-29

    申请号:CN202310315234.4

    申请日:2023-03-28

    Abstract: 本公开提供了一种事件抽取方法及装置,该方法首先依据小样本数据对通用信息抽取模型进行微调,然后将生语料数据输入微调后的通用信息抽取模型进行预测,得到新增样本数据,之后将小样本数据和新增样本数据作为训练数据对ERNIE模型进行训练,依据训练好的ERNIE模型对目标文本进行编码,得到相应的特征向量,最后依据Global Pointer模型对特征向量进行解码,得到事件元素,该方法基于UIE、ERNIE和Global Pointer进行事件元素的抽取,可以针对领域事件抽取标注数据样本较少的问题,通过自动化的方式对训练样本进行扩充,将准确率、召回率和F1作为评价指标,提高了事件识别任务上和论元识别任务上的F1值,能有效提升小样本下的抽取性能,并且还解决了论元重叠的问题。

    获取分子表示数据的方法及分子属性获取方法

    公开(公告)号:CN114678075A

    公开(公告)日:2022-06-28

    申请号:CN202210302098.0

    申请日:2022-03-24

    Abstract: 本公开提供一种基于分子结构信息获取分子表示数据的方法,包括:对于组成分子的各个原子,获取单个原子外层的各个电子轨道结构数据,并生成基于波函数表示的各个电子轨道结构数据,将波函数表示的各个电子轨道结构数据作为原子结构数据;在组成分子的单个原子的体素空间内,将基于波函数表示的各个电子轨道结构数据进行组合,形成基于波函数的原子卷积核;在组成分子的所有原子的整个体素空间内,对构成分子的各个原子,通过各个原子对应的基于波函数的原子卷积核进行卷积操作,分子的各个原子经对应的基于波函数的原子卷积核卷积操作后,生成基于体素的可视化分子表示数据。本公开还提供了一种分子属性获取方法。

    面向Solidity智能合约的缺陷预测方法

    公开(公告)号:CN112579463A

    公开(公告)日:2021-03-30

    申请号:CN202011562073.1

    申请日:2020-12-25

    Abstract: 本发明公开了一种面向Solidity智能合约的缺陷预测方法,应用于软件缺陷预测技术领域,首先从Solidity源码中提取代码模块的度量元,并为每个代码模块标记缺陷数量,从而构建缺陷预测数据集;然后针对Solidity缺陷预测数据集中的类不平衡问题,采用过采样方法进行数据预处理;最后分别构建缺陷数量预测模型和缺陷倾向性预测模型,并评估模型的性能。本发明将度量元集与Solidity智能合约缺陷检测结果结合,构建了Solidity智能合约缺陷预测数据集,能够更好地描述Solidity智能合约的特征,基于以上数据集,分别验证了缺陷数量预测和缺陷倾向性预测问题中,不同模型的性能差异。

Patent Agency Ranking