-
公开(公告)号:CN118504566A
公开(公告)日:2024-08-16
申请号:CN202410568923.0
申请日:2024-05-09
Applicant: 中国矿业大学
IPC: G06F40/295 , G06F40/16 , G06N3/0442 , G06N3/045 , G06N3/0455 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于字符对网格表示的嵌套命名实体识别方法,包括以下步骤:首先,收集数据,构建中文命名实体识别语料库;其次,通过预训练模型和双向门控循环单元获得句子的向量化文本,使用多头双仿射注意力机制和多尺度融合方法相结合,增强对实体相邻关系建模信息的学习能力;同时考虑边界特征,有效利用实体边界信息。本发明在包含扁平实体和嵌套实体的中文海战领域命名实体识别语料库和中文细粒度数据集上进行了实验,结果显示本发明有效解决了扁平实体和嵌套实体统一识别的问题,相较于其他模型取得了有竞争力的结果。