-
公开(公告)号:CN111046167B
公开(公告)日:2021-04-16
申请号:CN201911081064.8
申请日:2019-11-07
Applicant: 武汉大学
IPC: G06F16/34 , G06F16/383 , G06K9/62
Abstract: 本发明公开了一种科技情报分析中结合时滞计算的学科主题演化推理方法,首先获取多源数据,形成多源科技文献数据集;从多源数据融合的角度,利用LDA模型对分布广泛、种类繁多的学科文本抽取学科主题;采用匈牙利算法实现相似矩阵二分图匹配,寻求最优匹配组合,以匹配结果构建假设,拟合线性方程,进而计算多源科技文献时滞程度;结合学科主题相似度与时滞程度融合多源数据的学科主题,构建学科主题演化过程,跟踪学科主题演化情况。本发明能够通过计算的多源数据时滞程度融合不同来源数据的主题,改善单一数据源主题演化的缺陷,增强主题演化趋势的准确性。
-
公开(公告)号:CN111046167A
公开(公告)日:2020-04-21
申请号:CN201911081064.8
申请日:2019-11-07
Applicant: 武汉大学
IPC: G06F16/34 , G06F16/383 , G06K9/62
Abstract: 本发明公开了一种科技情报分析中结合时滞计算的学科主题演化推理方法,首先获取多源数据,形成多源科技文献数据集;从多源数据融合的角度,利用LDA模型对分布广泛、种类繁多的学科文本抽取学科主题;采用匈牙利算法实现相似矩阵二分图匹配,寻求最优匹配组合,以匹配结果构建假设,拟合线性方程,进而计算多源科技文献时滞程度;结合学科主题相似度与时滞程度融合多源数据的学科主题,构建学科主题演化过程,跟踪学科主题演化情况。本发明能够通过计算的多源数据时滞程度融合不同来源数据的主题,改善单一数据源主题演化的缺陷,增强主题演化趋势的准确性。
-