-
公开(公告)号:CN111782827A
公开(公告)日:2020-10-16
申请号:CN202010313735.5
申请日:2020-04-20
Applicant: 北京工业大学
IPC: G06F16/38 , G06F16/34 , G06F40/194 , G06N20/00
Abstract: 本公开提供了一种引文重要性识别方法、装置、电子设备及计算机存储介质,涉及科学计量、情报分析和机器学习领域。该方法包括:获取施引文献和被引文献的信息,在施引文献中提取出被引文献对应的引用语境信息,确定施引文献与被引文献之间的第一关系特征;通过产生式模型提取施引文献与被引文献的第二关系特征;确定被引文献对施引文献的重要度。本公开实施例根据引用语境信息确定第一关系特征,利用预设的产生式模型提取施引文献和被引文献的第二关系特征,然后采用通过判别式模型确定的规则,根据第一关系特征和第二关系特征对被引文献在施引文献中的重要性进行分析,通过产生式模型和判别式模型相结合,提高重要性引文的识别效果。
-
公开(公告)号:CN111143511A
公开(公告)日:2020-05-12
申请号:CN201911293311.0
申请日:2019-12-16
Applicant: 北京工业大学
IPC: G06F16/33 , G06F16/35 , G06F40/258 , G06F40/289
Abstract: 本申请实施例提供了一种新兴技术预测方法、装置、电子设备及介质。该方法包括:获取目标领域的多篇目标文献,对多篇目标文献进行分词处理并过滤预设词汇,得到各篇目标文献对应的目标词汇,对各篇目标文献对应的目标词汇进行聚类处理,得到至少一个主题以及各个主题的多项式概率分布,任一主题包括至少一个目标词汇,任一主题的多项式概率分布为各篇目标文献分别属于任一主题的概率,基于各个主题的多项式概率分布,从至少一个主题中确定新兴技术主题,以根据新兴技术主题预测新兴技术。本申请实施例实现了预测新兴技术的效果较好,提升用户体验。
-
公开(公告)号:CN117669572B
公开(公告)日:2024-10-29
申请号:CN202311688772.4
申请日:2023-12-08
Applicant: 北京工业大学
IPC: G06F40/295 , G06F40/30 , G06N5/02 , G06Q50/18 , G16C20/50
Abstract: 本申请实施例提供了一种信息处理方法、装置、电子设备及计算机可读存储介质,涉及数据挖掘技术领域。该方法包括:获取目标领域相关联的多个对象的对象信息;根据对象信息确定多个对象之间的引用关系;基于引用关系构建异构网络,并提取异构网络的骨架结构;对骨架结构进行可视化展示,以便基于可视化的骨架结构确定目标领域的分析结果。本申请实施例通过构建异构网络并提取异构网络的骨架结构,实现对目标领域的精准分析,提升数据分析结果的精确性,提高产业未来发展趋势的预测准确性。
-
公开(公告)号:CN117391073B
公开(公告)日:2024-09-06
申请号:CN202311238385.0
申请日:2023-09-22
Applicant: 北京工业大学
IPC: G06F40/279 , G06F16/35 , G06F18/241
Abstract: 本申请实施例提供了一种文献识别方法、装置、电子设备和存储介质,涉及数据挖掘和技术情报分析领域。该方法包括:确定文献集的语料集,所述文献集包括多篇原始文献,多篇原始文献包括待识别的第一原始文献;将每篇第一原始文献的术语集作为第一术语集,对每个第一术语集,根据语料集中的各个术语集,确定第一术语集的预设参考指标的指标值;向预设分类模型发送每个第一术语集的预设参考指标的指标值,获得识别结果,识别结果表征每个第一术语集所属的第一原始文献是否涉及目标技术。本申请实施例实现了基于术语集识别一个文献是否涉及创新程度和技术影响程度达到预设条件的目标技术的目的。
-
公开(公告)号:CN112765305B
公开(公告)日:2024-05-14
申请号:CN202011625275.6
申请日:2020-12-31
Applicant: 北京工业大学
IPC: G06F16/31 , G06F40/284
Abstract: 本申请实施例提供了一种作者的兴趣主题的分析方法、装置、电子设备及存储介质,涉及信息分析技术领域。该方法包括:获取目标领域的至少一篇文献,确定文献中每个作者的贡献权重,每个单词在文献中表达的主题以及文献中每个作者负责的单词;根据每个单词在文献中表达的主题、文献中每个作者负责的单词以及文献中每个作者的贡献权重,得到文献中每个作者表达的主题,根据作者在相关文献负责的内容所表达的主题,确定作者的兴趣主题。本申请实施例能够考虑每一位共同作者对一篇多作者文章贡献不等的前提下,发现各作者的兴趣主题,合理反映科研人员的兴趣主题,有助于发掘学科领域的研究热点及趋势,并推进个性化学术研究。
-
公开(公告)号:CN117669572A
公开(公告)日:2024-03-08
申请号:CN202311688772.4
申请日:2023-12-08
Applicant: 北京工业大学
IPC: G06F40/295 , G06F40/30 , G06N5/02 , G06Q50/18 , G16C20/50
Abstract: 本申请实施例提供了一种信息处理方法、装置、电子设备及计算机可读存储介质,涉及数据挖掘技术领域。该方法包括:获取目标领域相关联的多个对象的对象信息;根据对象信息确定多个对象之间的引用关系;基于引用关系构建异构网络,并提取异构网络的骨架结构;对骨架结构进行可视化展示,以便基于可视化的骨架结构确定目标领域的分析结果。本申请实施例通过构建异构网络并提取异构网络的骨架结构,实现对目标领域的精准分析,提升数据分析结果的精确性,提高产业未来发展趋势的预测准确性。
-
-
公开(公告)号:CN112765305A
公开(公告)日:2021-05-07
申请号:CN202011625275.6
申请日:2020-12-31
Applicant: 北京工业大学
IPC: G06F16/31 , G06F40/284
Abstract: 本申请实施例提供了一种作者的兴趣主题的分析方法、装置、电子设备及存储介质,涉及信息分析技术领域。该方法包括:获取目标领域的至少一篇文献,确定文献中每个作者的贡献权重,每个单词在文献中表达的主题以及文献中每个作者负责的单词;根据每个单词在文献中表达的主题、文献中每个作者负责的单词以及文献中每个作者的贡献权重,得到文献中每个作者表达的主题,根据作者在相关文献负责的内容所表达的主题,确定作者的兴趣主题。本申请实施例能够考虑每一位共同作者对一篇多作者文章贡献不等的前提下,发现各作者的兴趣主题,合理反映科研人员的兴趣主题,有助于发掘学科领域的研究热点及趋势,并推进个性化学术研究。
-
公开(公告)号:CN111767706A
公开(公告)日:2020-10-13
申请号:CN202010568868.7
申请日:2020-06-19
Applicant: 北京工业大学
IPC: G06F40/194 , G06F40/30 , G06K9/62
Abstract: 本申请实施例提供了一种文本相似度的计算方法、装置、电子设备及介质。该方法包括:对于每两个目标文本,计算一个目标文本所包含的各个第一序列与另一个目标文本所包含的各个第二序列之间的相似度,得到两个目标文本之间的序列相似度,第一序列和第二序列为分别从对应目标文本中提取的实体关系序列;对于每两个目标文本,利用该两个目标文本之间的序列相似度,计算该两个目标文本的相似度。本申请实施例实现了通过计算一个文本所包含的各个实体关系序列与另一个文本所包含的各个实体关系序列之间的相似度,从而计算两个文本之间的相似度,可以大大提升结算结果的准确性。
-
公开(公告)号:CN110781281A
公开(公告)日:2020-02-11
申请号:CN201911018881.9
申请日:2019-10-24
Applicant: 北京工业大学
IPC: G06F16/33
Abstract: 本发明实施例公开了一种新兴主题的探测方法、装置、计算机设备及存储介质,包括下述步骤:获取目标领域的数据集,其中,所述数据集包括目标领域的文献信息以及每篇文献的引文信息;根据预设的主题抽取规则在所述数据集中抽取研究主题;计算所述研究主题的新兴指标;根据所述新兴指标在所述研究主题中确定所述目标领域的新兴主题。通过这种方法不仅可以识别某一领域的新兴研究主题,而且可以预测该领域未来的新兴研究主题。运用了结合引文关系网络分析法和文本挖掘法的混合方法,发挥了多种机器学习模型的优势,结合这两种方法来探测新兴研究主题,克服了使用任意单一方法的缺陷,可以获得易于解释的新兴研究主题结果。
-
-
-
-
-
-
-
-
-