水稻病虫害领域命名实体识别方法

    公开(公告)号:CN117094325B

    公开(公告)日:2024-03-29

    申请号:CN202311240372.7

    申请日:2023-09-25

    Abstract: 本发明公开了一种水稻病虫害领域命名实体识别方法,包括以下步骤:步骤S1、获取水稻病虫害领域实体的文本数据;步骤S2、对部分文本数据按实体进行数据标注构建训练集,其余为未标注文本数据;步骤S3、构建识别模型,利用训练集对识别模型进行训练得到基准模型;步骤S4、利用基准模型预测未标注文本数据得到带有伪标签的文本数据;将带有伪标签的文本数据扩充训练集对基准模型进行训练,得到最终识别模型;步骤S5、利用最终识别模型识别水稻病虫害实体。本发明解决了缺乏训练数据、实体结构复杂、实体类型多样、实体分布不均问题、解决缺乏训练数据问题,减少当前大多数命名实体识别模型对高质量标注数据集的依赖。

    水稻病虫害领域命名实体识别方法

    公开(公告)号:CN117094325A

    公开(公告)日:2023-11-21

    申请号:CN202311240372.7

    申请日:2023-09-25

    Abstract: 本发明公开了一种水稻病虫害领域命名实体识别方法,包括以下步骤:步骤S1、获取水稻病虫害领域实体的文本数据;步骤S2、对部分文本数据按实体进行数据标注构建训练集,其余为未标注文本数据;步骤S3、构建识别模型,利用训练集对识别模型进行训练得到基准模型;步骤S4、利用基准模型预测未标注文本数据得到带有伪标签的文本数据;将带有伪标签的文本数据扩充训练集对基准模型进行训练,得到最终识别模型;步骤S5、利用最终识别模型识别水稻病虫害实体。本发明解决了缺乏训练数据、实体结构复杂、实体类型多样、实体分布不均问题、解决缺乏训练数据问题,减少当前大多数命名实体识别模型对高质量标注数据集的依赖。

Patent Agency Ranking