发明公开
- 专利标题: 一种基于多特征融合的双图神经网络医疗命名实体识别方法
-
申请号: CN202311317519.8申请日: 2023-10-11
-
公开(公告)号: CN117408255A公开(公告)日: 2024-01-16
- 发明人: 马甲林 , 古汉钊 , 韩庆宾 , 李澳繁 , 谢乾 , 汪涛
- 申请人: 淮阴工学院
- 申请人地址: 江苏省淮安市经济技术开发区枚乘东路1号
- 专利权人: 淮阴工学院
- 当前专利权人: 淮阴工学院
- 当前专利权人地址: 江苏省淮安市经济技术开发区枚乘东路1号
- 代理机构: 淮安市科文知识产权事务所
- 代理商 吴晶晶
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/211 ; G06F40/14 ; G06F40/30 ; G16H50/70 ; G06N3/042 ; G06N3/0442 ; G06N3/0464 ; G06N3/048 ; G06N3/084
摘要:
本发明提供了一种基于多特征融合的双图神经网络医疗命名实体识别方法,将文本序列进行数据预处理;一方面将其输入到双向长短期记忆网络中获取上下文特征;另一方面分别构建词共现图和依存句法图;图卷积神经网络根据图结构的节点关系来学习节点之间的依赖和相互作用,得到全局特征信息;将上下文特征信息和全局特征信息进行特征融合,采用多头自注意力机制来计算特征内部的依赖关系,得到综合特征信息;使用CRF模型计算综合特征信息并进行序列标注,得到最优标注序列。与现有技术相比,本发明通过构建词共现图、依存句法图,从双图角度提取文本特征,并引入多头自注意力机制来计算特征内部的依赖关系,有效提升医疗命名实体识别的准确性。