- 专利标题: 一种增强词典知识融入的中文命名实体识别方法
-
申请号: CN202310914876.6申请日: 2023-07-25
-
公开(公告)号: CN117113997B公开(公告)日: 2024-07-09
- 发明人: 琚生根 , 赵振宇 , 朱静静 , 夏欣
- 申请人: 四川大学
- 申请人地址: 四川省成都市一环路南一段24号
- 专利权人: 四川大学
- 当前专利权人: 四川大学
- 当前专利权人地址: 四川省成都市一环路南一段24号
- 代理机构: 北京中索知识产权代理有限公司
- 代理商 唐亭
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/216 ; G06N3/048 ; G06N3/08
摘要:
本发明公开了一种增强词典知识融入的中文命名实体识别方法,涉及自然语言处理技术领域,在输入表示层中,汉字、词语以及字词间的关系通过3个嵌入查找表编码为稠密向量。在整合层中,利用交叉注意力网络来获取每一个汉字的词典表示,并且构造门控网络自适应的融合每一个汉字的上下文信息和其词典表示。最后,在解码层中使用双向门控循环单元(BiGRU)结合条件随机场的方式为每一个句子中的汉字分配实体标签。本发明的中文命名实体识别任务有巨大优势并且也能够很容易地与BERT等其他自然语言处理的预训练模型相结合来获得更强大的性能表现。
公开/授权文献
- CN117113997A 一种增强词典知识融入的中文命名实体识别方法 公开/授权日:2023-11-24