-
公开(公告)号:CN115409036B
公开(公告)日:2023-05-12
申请号:CN202210976806.9
申请日:2022-08-15
Applicant: 中国中医科学院中药研究所 , 中国中医科学院中医药信息研究所
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种基于双模式的中医古籍文本实体关系抽取方法及装置。方法包括:获取待抽取的中医古籍文本;确定中医古籍文本中各实体的实体类型;根据预设的关键词判定规则,确定中医古籍文本中的关键词,其中,关键词至少包括加药关键词、减药关键词、合方关键词、禁忌关键词、强关联关键词以及文本切片关键词;基于各实体的实体类型以及关键词,在中医古籍文本中抽取实体组合;基于实体组合进行实体关系抽取,并实例化为关系三元组,关系三元组由两个实体和两个实体之间的实体关系组成;将关系三元组以图数据库的形式存储起来。采用本发明,可以提高中医古籍文本实体关系抽取的准确性。
-
公开(公告)号:CN115409036A
公开(公告)日:2022-11-29
申请号:CN202210976806.9
申请日:2022-08-15
Applicant: 中国中医科学院中药研究所 , 中国中医科学院中医药信息研究所
Abstract: 本发明涉及自然语言处理技术领域,特别是指一种基于双模式的中医古籍文本实体关系抽取方法及装置。方法包括:获取待抽取的中医古籍文本;确定中医古籍文本中各实体的实体类型;根据预设的关键词判定规则,确定中医古籍文本中的关键词,其中,关键词至少包括加药关键词、减药关键词、合方关键词、禁忌关键词、强关联关键词以及文本切片关键词;基于各实体的实体类型以及关键词,在中医古籍文本中抽取实体组合;基于实体组合进行实体关系抽取,并实例化为关系三元组,关系三元组由两个实体和两个实体之间的实体关系组成;将关系三元组以图数据库的形式存储起来。采用本发明,可以提高中医古籍文本实体关系抽取的准确性。
-