-
公开(公告)号:CN111782827B
公开(公告)日:2024-10-25
申请号:CN202010313735.5
申请日:2020-04-20
Applicant: 北京工业大学
IPC: G06F16/38 , G06F16/34 , G06F40/194 , G06N20/00
Abstract: 本公开提供了一种引文重要性识别方法、装置、电子设备及计算机存储介质,涉及科学计量、情报分析和机器学习领域。该方法包括:获取施引文献和被引文献的信息,在施引文献中提取出被引文献对应的引用语境信息,确定施引文献与被引文献之间的第一关系特征;通过产生式模型提取施引文献与被引文献的第二关系特征;确定被引文献对施引文献的重要度。本公开实施例根据引用语境信息确定第一关系特征,利用预设的产生式模型提取施引文献和被引文献的第二关系特征,然后采用通过判别式模型确定的规则,根据第一关系特征和第二关系特征对被引文献在施引文献中的重要性进行分析,通过产生式模型和判别式模型相结合,提高重要性引文的识别效果。
-
公开(公告)号:CN117391073A
公开(公告)日:2024-01-12
申请号:CN202311238385.0
申请日:2023-09-22
Applicant: 北京工业大学
IPC: G06F40/279 , G06F16/35 , G06F18/241
Abstract: 本申请实施例提供了一种文献识别方法、装置、电子设备和存储介质,涉及数据挖掘和技术情报分析领域。该方法包括:确定文献集的语料集,所述文献集包括多篇原始文献,多篇原始文献包括待识别的第一原始文献;将每篇第一原始文献的术语集作为第一术语集,对每个第一术语集,根据语料集中的各个术语集,确定第一术语集的预设参考指标的指标值;向预设分类模型发送每个第一术语集的预设参考指标的指标值,获得识别结果,识别结果表征每个第一术语集所属的第一原始文献是否涉及目标技术。本申请实施例实现了基于术语集识别一个文献是否涉及创新程度和技术影响程度达到预设条件的目标技术的目的。
-
公开(公告)号:CN117390174A
公开(公告)日:2024-01-12
申请号:CN202311616745.6
申请日:2023-11-29
Applicant: 北京工业大学
IPC: G06F16/335 , G06F16/35 , G06F18/2411 , G06F18/2415 , G06F18/243 , G06F18/214 , G06F18/21
Abstract: 本申请公开了一种学术论文推荐方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域。该方法包括:确定目标专利文献和至少一个参考学术论文;使用目标分类模型,从至少一个参考学术论文中确定与目标专利文献具有直接引用关系的学术论文,作为待推荐的学术论文;其中,目标分类模型由多个正样本和多个负样本对初始目标分类模型训练得到;正样本包括存在直接引用关系的专利文献和学术论文;负样本包括存在非直接引用关系的专利文献和学术论文。本申请实施例通过构建专利文献与学术论文间的异质信息网络,充分融合专利文献与学术论文的关联关系,实现专利文献与学术论文间的链路预测,为目标专利文献高效的提供待推荐的学术论文。
-
公开(公告)号:CN112733542B
公开(公告)日:2022-02-08
申请号:CN202110049136.1
申请日:2021-01-14
Applicant: 北京工业大学
IPC: G06F40/295 , G06F40/44 , G06F40/30 , G06K9/62
Abstract: 本申请实施例提供了一种主题的探测方法、装置、电子设备及存储介质,涉及信息处理技术领域。该方法包括:获取目标领域中至少两个文本集,并设置预设数量的主题以及主题类别;根据上一次文本集中主题以及主题类别的分配情况,确定本次分配中单词被分配至任意一个主题的第一概率以及被分配至任意一个主题类别的第二概率;根据本次分配中第一概率以及第二概率,对文本集中所有单词分配主题以及主题类别;根据最后一次分配中文本集中每个单词的主题以及主题类别,确定文本集中的主题的分布情况以及主题类别的分布情况。本申请实施例得到了对多源异构文本资源间的科技关联分析更深层次、更可靠的结果。
-
公开(公告)号:CN107958025B
公开(公告)日:2021-12-28
申请号:CN201711113364.0
申请日:2017-11-13
Applicant: 北京工业大学 , 北京睿泰数字科技有限公司
Abstract: 本发明提供一种弱监督实体关系抽取方法及其装置和电子设备,本发明提供的技术方案中,通过在文档合集中获取多组已组合的候选实体对,候选实体对中包含具有实体关系的两个实体;分别抽取各组候选实体对相应的多元语法特征;根据多元语法特征,生成各组候选实体对相应的状态变量和特征向量;根据各组候选实体对分别对应的多元语法特征、状态变量和特征向量来训练预设的实体关系抽取模型,以抽取各组候选实体对中的实体关系对应的关系类型,本发明有效应用多元语法特征,并有机地集成到预设的实体关系抽取模型中,更全面地综合了语言的复杂性和表达的多样性,使得实体关系的识别更为准确,有效提升了弱监督学习实体关系抽取的效果。
-
公开(公告)号:CN112733542A
公开(公告)日:2021-04-30
申请号:CN202110049136.1
申请日:2021-01-14
Applicant: 北京工业大学
IPC: G06F40/295 , G06F40/44 , G06F40/30 , G06K9/62
Abstract: 本申请实施例提供了一种主题的探测方法、装置、电子设备及存储介质,涉及信息处理技术领域。该方法包括:获取目标领域中至少两个文本集,并设置预设数量的主题以及主题类别;根据上一次文本集中主题以及主题类别的分配情况,确定本次分配中单词被分配至任意一个主题的第一概率以及被分配至任意一个主题类别的第二概率;根据本次分配中第一概率以及第二概率,对文本集中所有单词分配主题以及主题类别;根据最后一次分配中文本集中每个单词的主题以及主题类别,确定文本集中的主题的分布情况以及主题类别的分布情况。本申请实施例得到了对多源异构文本资源间的科技关联分析更深层次、更可靠的结果。
-
公开(公告)号:CN108052636A
公开(公告)日:2018-05-18
申请号:CN201711387857.3
申请日:2017-12-20
Abstract: 本发明实施例提供了一种确定文本主题关联度的方法、装置及终端设备,其中,确定文本主题关联度的方法,包括:根据预设处理方式,对获取到的第一预设个数的第一文献信息与第二预设个数的第二文献信息分别进行预处理,第一文献信息为第一文本资源对应的文献信息,第二文献信息为第二文本资源对应的文献信息;通过预设的实体‑主题模型,分别从预处理后的第一文献信息及预处理后的第二文献信息中提取主题信息,得到对应的第三预设个数的第一词汇主题与第四预设个数的第二词汇主题;基于第三预设个数的第一词汇主题与第四预设个数的第二词汇主题,确定第一文本资源与第二文本资源的主题关联强度。能够确定存在异构性的文本资源之间的主题关联度。
-
公开(公告)号:CN106779429B
公开(公告)日:2020-01-24
申请号:CN201611211608.4
申请日:2016-12-25
Applicant: 北京工业大学
Abstract: 本发明公开了基于AFC刷卡数据的轨道换乘站点客流拥塞风险评价方法,包括:AFC原始交易数据预处理;基于AFC刷卡数据的轨道换乘站点客流拥塞评价。以数据库分析和数据挖掘技术为依托,对AFC原始刷卡数据进行提取、剔除和筛选、换乘客流识别等预处理。基于AFC刷卡数据获取不同时段换乘站点的进站、出站及换乘客流量,基于人工实地测量换乘站内各典型位置的物理参数;构建典型位置客流饱和度评价指标,用于综合衡量各位置的客流需求与供给关系;根据评价时段内的指标极大值作为模型的输入值进行模型参数的标定;根据熵权法计算不同典型位置的饱和度指标在模型中的权重,并对风险评价进行聚类,划分轨道换乘站点客流拥塞五级风险等级。
-
公开(公告)号:CN107958025A
公开(公告)日:2018-04-24
申请号:CN201711113364.0
申请日:2017-11-13
Applicant: 北京工业大学 , 北京睿泰数字科技有限公司
IPC: G06F17/30
CPC classification number: G06F17/30734 , G06F17/30666 , G06F17/30684
Abstract: 本发明提供一种弱监督实体关系抽取方法及其装置和电子设备,本发明提供的技术方案中,通过在文档合集中获取多组已组合的候选实体对,候选实体对中包含具有实体关系的两个实体;分别抽取各组候选实体对相应的多元语法特征;根据多元语法特征,生成各组候选实体对相应的状态变量和特征向量;根据各组候选实体对分别对应的多元语法特征、状态变量和特征向量来训练预设的实体关系抽取模型,以抽取各组候选实体对中的实体关系对应的关系类型,本发明有效应用多元语法特征,并有机地集成到预设的实体关系抽取模型中,更全面地综合了语言的复杂性和表达的多样性,使得实体关系的识别更为准确,有效提升了弱监督学习实体关系抽取的效果。
-
公开(公告)号:CN114691814B
公开(公告)日:2023-11-10
申请号:CN202210398913.8
申请日:2022-04-15
Applicant: 北京工业大学
Abstract: 本申请实施例提供一种信息处理方法、装置、电子设备及存储介质,涉及科技情报、数据挖掘、文献计量分析领域。该方法包括获取待处理网络;待处理网络包括多个第一元素和多个第二元素;确定各第一元素的初始权重和各第二元素的初始权重;将各第一元素的初始权重对应转换为各第二元素的转换权重;将每一第二元素的初始权重和每一第二元素的转换权重进行加权处理,得到每一第二元素的融合权重;基于各第二元素的融合权重,确定目标领域的演化路径。本申请实施例可以将节点权重和链接权重相互转换,基于节点或链接的融合权重,得到演化路径,弥补了现有技术的链接重要性或节点重要性的演化轨迹探测方法的不足,提高了演化路径的准确性。
-
-
-
-
-
-
-
-
-