-
公开(公告)号:CN114692602B
公开(公告)日:2025-04-29
申请号:CN202210290585.X
申请日:2022-03-23
Applicant: 浙江工业大学
IPC: G06F40/211 , G06N3/0455 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种句法信息注意力引导的图卷积网络关系抽取方法,包括以下步骤:1)基于BERT预训练模型的字向量表示;2)基于双向长短期记忆网络来对每个单词进行上下文编码,得到包含上下文信息的每个单词的向量表示;3)融合句法依赖类型信息的图卷积网络词节点特征表示;4)通过得到的句子向量的特征表示进行关系抽取。本发明在关系抽取模型建模中考虑了依存类型信息,提高了关系抽取模型的性能。
-
公开(公告)号:CN113609859A
公开(公告)日:2021-11-05
申请号:CN202110893472.4
申请日:2021-08-04
Applicant: 浙江工业大学
IPC: G06F40/295 , G06F16/35 , G06F16/36 , G06F40/216 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 一种基于预训练模型的特种设备中文命名实体识别方法,包括以下步骤:1)按照中文命名实体标注策略BIEOS对中文命名实体数据集进行标注,将实体类别分为四种类别;2)基于BERT预训练模型将中文句子转换为字向量表示;3)将字向量表示输入到biLSTM模型中,学习字向量序列双向编码,提取句子特征;4)采用CRF条件随机场学习上下文的标签概率,得到了每个汉字的所有可能的标签序列;5)最后输出汉字序列对应的实体类别。本发明通过无监督的方式对无标签语料中进行训练,能够有效解决小数据集、样本特征信息不足情况下中文命名实体提取的问题,用于构建特种设备领域的知识图谱。
-
公开(公告)号:CN114692602A
公开(公告)日:2022-07-01
申请号:CN202210290585.X
申请日:2022-03-23
Applicant: 浙江工业大学
IPC: G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种句法信息注意力引导的图卷积网络关系抽取方法,包括以下步骤:1)基于BERT预训练模型的字向量表示;2)基于双向长短期记忆网络来对每个单词进行上下文编码,得到包含上下文信息的每个单词的向量表示;3)融合句法依赖类型信息的图卷积网络词节点特征表示;4)通过得到的句子向量的特征表示进行关系抽取。本发明在关系抽取模型建模中考虑了依存类型信息,提高了关系抽取模型的性能。
-
公开(公告)号:CN113609859B
公开(公告)日:2024-12-03
申请号:CN202110893472.4
申请日:2021-08-04
Applicant: 浙江工业大学
IPC: G06F40/295 , G06F16/35 , G06F16/36 , G06F40/216 , G06N3/0442 , G06N3/042 , G06N3/0455 , G06N3/088 , G06N5/022
Abstract: 一种基于预训练模型的特种设备中文命名实体识别方法,包括以下步骤:1)按照中文命名实体标注策略BIEOS对中文命名实体数据集进行标注,将实体类别分为四种类别;2)基于BERT预训练模型将中文句子转换为字向量表示;3)将字向量表示输入到biLSTM模型中,学习字向量序列双向编码,提取句子特征;4)采用CRF条件随机场学习上下文的标签概率,得到了每个汉字的所有可能的标签序列;5)最后输出汉字序列对应的实体类别。本发明通过无监督的方式对无标签语料中进行训练,能够有效解决小数据集、样本特征信息不足情况下中文命名实体提取的问题,用于构建特种设备领域的知识图谱。
-
-
-