-
公开(公告)号:CN115391569A
公开(公告)日:2022-11-25
申请号:CN202211325252.2
申请日:2022-10-27
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/36 , G06F40/295 , G06Q50/04
Abstract: 本发明公开了一种从研报自动构建产业链图谱的方法及相关设备。方法包括:载入面向研报的产业链图谱模式;获取原始研报文档集合,分别对原始研报集合中的每一个原始研报文本进行预处理,得到目标文本;采用实体关系同步抽取模型同时抽取句子序列中的目标三元组和目标独立实体;采用指标属性抽取模型抽取含有指标描述的句子序列中的目标属性对;将获取到的一个或多个所述目标属性对与初始第二三元组进行匹配对齐,得到目标第二三元组;将目标第一三元组和目标第二三元组添加到目标产业链图谱。本发明提供的从研报自动构建产业链图谱的方法能有效应对复杂情境下通过研报文本自动化构建大规模产业链图谱的需求,降低人力损耗与时间成本。
-
公开(公告)号:CN115391569B
公开(公告)日:2023-03-24
申请号:CN202211325252.2
申请日:2022-10-27
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/36 , G06F40/295 , G06Q50/04
Abstract: 本发明公开了一种从研报自动构建产业链图谱的方法及相关设备。方法包括:载入面向研报的产业链图谱模式;获取原始研报文档集合,分别对原始研报集合中的每一个原始研报文本进行预处理,得到目标文本;采用实体关系同步抽取模型同时抽取句子序列中的目标三元组和目标独立实体;采用指标属性抽取模型抽取含有指标描述的句子序列中的目标属性对;将获取到的一个或多个所述目标属性对与初始第二三元组进行匹配对齐,得到目标第二三元组;将目标第一三元组和目标第二三元组添加到目标产业链图谱。本发明提供的从研报自动构建产业链图谱的方法能有效应对复杂情境下通过研报文本自动化构建大规模产业链图谱的需求,降低人力损耗与时间成本。
-