基于三阶段的小样本嵌套命名实体识别方法和系统

    公开(公告)号:CN116776885A

    公开(公告)日:2023-09-19

    申请号:CN202310784041.3

    申请日:2023-06-29

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于三阶段的小样本嵌套命名实体识别方法和系统,首先根据原始嵌套NER数据集采样,保证每种类别采样得到的实体数量一致,初步构建嵌套NER小样本数据集;再从原始嵌套NER数据集的训练集、验证集以及测试集中分别采样K个实体实例,得到嵌套NER小样本训练数据集、验证集以及测试集;再构建嵌套NER模型,分别构建实体定位子模型、实体抽取子模型以及实体分类子模型,捕捉内层实体和外层实体的嵌套关系,构建特殊的软提示模板;最后训练嵌套NER模型,更好的支持小样本场景下的模型训练。

Patent Agency Ranking