- 专利标题: 一种中文医药知识图谱自动化构建方法、装置及介质
-
申请号: CN202210025139.6申请日: 2022-01-11
-
公开(公告)号: CN114528411B公开(公告)日: 2024-05-07
- 发明人: 卢俊宇 , 张平健
- 申请人: 华南理工大学
- 申请人地址: 广东省广州市天河区五山路381号
- 专利权人: 华南理工大学
- 当前专利权人: 华南理工大学
- 当前专利权人地址: 广东省广州市天河区五山路381号
- 代理机构: 广州嘉权专利商标事务所有限公司
- 代理商 郑宏谋
- 主分类号: G06F16/36
- IPC分类号: G06F16/36 ; G06F40/295 ; G16H10/00
摘要:
本发明公开了一种中文医药知识图谱自动化构建方法、装置及介质,其中方法包括:获取中文医药数据,对中文医药数据进行预处理,获得段落列表;采用实体识别模型,对所述段落列表中的每段文本进行实体识别,获取实体数据列表,以及整理得到实体表;根据实体类型对,对实体数据列表中的实体进行组合,形成实体对,并构建关系数据列表;采用关系抽取模型,对关系数据列表进行关系抽取,获得三元组列表;对实体表和三元组列表进行实体对齐,将对齐后的数据存储入图数据库中,实现知识图谱的构建。本发明提供了一种高质量的中文医药知识图谱自动化构建方案,用于构建医药文本相关的知识图谱,对医疗领域具有重要作用,可广泛应用于医疗信息领域。
公开/授权文献
- CN114528411A 一种中文医药知识图谱自动化构建方法、装置及介质 公开/授权日:2022-05-24