发明公开
- 专利标题: 一种命名实体自动识别方法、系统与计算机可读存储介质
-
申请号: CN202410719843.0申请日: 2024-06-05
-
公开(公告)号: CN118839695A公开(公告)日: 2024-10-25
- 发明人: 董晓明 , 张舒 , 陶鹏 , 张龙剑 , 余建
- 申请人: 中国舰船研究设计中心
- 申请人地址: 湖北省武汉市武昌区张之洞路268号
- 专利权人: 中国舰船研究设计中心
- 当前专利权人: 中国舰船研究设计中心
- 当前专利权人地址: 湖北省武汉市武昌区张之洞路268号
- 代理机构: 湖北武汉永嘉专利代理有限公司
- 代理商 林文鑫; 胡建平
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/211
摘要:
本发明公开了一种命名实体自动识别方法、系统与计算机可读存储介质,包括:根据预设特定领域的实体知识在图数据集中构建知识图谱,对知识图谱中的命名实体名称进行句子切分,并生成到倒排索引表;将文档格式文件中的文本信息输入到预设的命名实体识别模型中,并通过自然语言处理技术对文本信息进行预处理和句子切分;通过命名实体识别模型和AC树查找算法识别倒排索引表中的命名实体,并根据相似度算法对实体进行过滤得到过滤结果,滤除与预设特定领域无关的实体名称;根据过滤结果在知识图谱中查询对应的命名实体信息,并在预设页面显示命名实体的知识信息。本发明将有效地解决命名实体识别接口不便于调用的缺点,降低用户的使用复杂度,增加用户对领域实体进行正向设计时参考相关实体性能参数的便利度。