发明授权
- 专利标题: 一种基于深度学习的命名实体识别方法
-
申请号: CN202111107150.9申请日: 2021-09-22
-
公开(公告)号: CN113869051B公开(公告)日: 2024-08-02
- 发明人: 黑新宏 , 李育璠 , 朱磊 , 王一川 , 姬文江 , 彭伟 , 董林靖
- 申请人: 西安理工大学
- 申请人地址: 陕西省西安市碑林区金花南路5号
- 专利权人: 西安理工大学
- 当前专利权人: 西安理工大学
- 当前专利权人地址: 陕西省西安市碑林区金花南路5号
- 代理机构: 西安弘理专利事务所
- 代理商 王奇
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/247 ; G06F40/242 ; G06F40/30 ; G06F16/35
摘要:
本发明公开了一种基于深度学习的命名实体识别方法,步骤包括:1)构建一对一的同义词词典;2)选择数据集,定义实体类集合;3)对BERT模型进行对比学习预训练;4)进行命名实体识别任务的微调训练,得到编码器和分类器;5)将测试集中剩余待处理的句子统称为句子S1;6)将句子S1输入编码器,得到字嵌入向量集合和句向量u;7)在句子S1中基于跨度选择文段,构造文段的词嵌入向量;8)利用同义词词典替换步骤7在句子S1中所选中的文段,得到句子S2;9)利用编码器处理句子S2,得到句向量v;10)计算得到span_em,再通过分类器分类得到实体集C。本发明的方法,识别准确率高。
公开/授权文献
- CN113869051A 一种基于深度学习的命名实体识别方法 公开/授权日:2021-12-31