一种大数据中基于生成式跨度的命名实体识别方法

    公开(公告)号:CN119129597A

    公开(公告)日:2024-12-13

    申请号:CN202411139788.4

    申请日:2024-08-20

    Abstract: 本发明一种大数据中基于生成式跨度的命名实体识别方法,包括:将文本句子输入训练好的命名实体识别模型,输出文本句子中的实体和实体的类别;其中,所述命名实体识别模型包括:特征提取模块、候选跨度生成模块和候选跨度分类模块;所述特征提取模块用于对输入文本句子进行特征提取得到文本句子中每个单词的特征向量;所述候选跨度生成模块用于根据每个单词的特征向量将文本句子中满足预设条件的单词作为跨度种子,并根据跨度种子生成候选跨度实体;所述候选跨度分类模块用于根据预设的模板对候选跨度实体进行分类得到该实体的类别,本发明能够能够同时识别扁平实体和嵌套实体,减少了计算量,提高识别的效率和准确性。

Patent Agency Ranking