一种用于海洋知识图谱的命名实体识别方法及系统

    公开(公告)号:CN118228730A

    公开(公告)日:2024-06-21

    申请号:CN202410227102.0

    申请日:2024-02-29

    Abstract: 本申请公开了一种用于海洋知识图谱的命名实体识别方法及系统,涉及命名实体识别的技术领域。方法包括:在BERT算法的预训练阶段,根据预训练结果对海洋关键词难度进行划分;在BERT算法微调阶段,对海洋关键词进行替换,根据海洋关键词的使用频率,分析海洋关键词的普及度;在BERT算法的命名实体识别阶段,获取待识别文本,识别待识别文本语句中的海洋关键词,根据海洋关键词的难度和普及度分析待识别文本语句难度;获取待识别文本语句长度与语句内容的比值,分析待识别文本的繁琐度;获取用户设置的难度阈值范围,筛选并去除超出难度阈值范围的待识别文本语句,得到命名实体识别结果。本申请提高了用于海洋知识图谱的命名实体识别的准确性。

Patent Agency Ranking