一种面向古籍的命名实体识别方法

    公开(公告)号:CN117787281A

    公开(公告)日:2024-03-29

    申请号:CN202311839688.8

    申请日:2023-12-28

    Abstract: 本发明公开了一种面向古籍的命名实体识别方法,涉及古籍命名实体识别技术领域,该方法针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型(ANER‑IPAL)。基于自建的古籍文本数据集,使用NEZHA‑TCN模型进行预训练,在嵌入层融合对抗学习增强模型泛化能力,在解码层引入全局指针网络,将实体识别任务建模为子串提取任务,最后结合规则进行结果的矫正输出。实验结果表明,所提模型在“古籍命名实体识别2023”数据集(GuNER2023)上的F1值达到了95.34%,相较于基线模型NEZHA‑GP提高了4.19%。

Patent Agency Ranking