-
公开(公告)号:CN104281882A
公开(公告)日:2015-01-14
申请号:CN201410472689.8
申请日:2014-09-16
Applicant: 中国科学院信息工程研究所
CPC classification number: G06Q50/01 , G06F16/958
Abstract: 本发明提供了基于用户特征的预测社交网络信息流行度的方法,该方法包括:获取社交网络中的用户数据和信息数据;从用户数据中提取部分用户属性特征及用户行为特征;根据用户属性特征和用户行为特征将用户数据进行分类;根据信息数据及用户的类别,得到信息数据对应的用户传播特征;根据用户传播特征得到社交网络信息流行度预测模型,采用预测模型对信息流行度进行预测。本发明提供的基于用户特征的预测社交网络信息流行度的系统,包括获取模块、特征提取模块、分类模块、处理模块、预测模型模块及预测模型。本发明结合用户行为特征的特点,更加准确地预测社交网络的信息传播,解决热点发现滞后、信息推送以及网络舆情监测实时性难以保证的问题。
-
公开(公告)号:CN115640850A
公开(公告)日:2023-01-24
申请号:CN202211110959.1
申请日:2022-09-13
Applicant: 中国科学院信息工程研究所
IPC: G06N5/022 , G06N3/094 , G06N3/0464 , G06F18/214 , G06F18/24 , G06F40/289
Abstract: 本发明涉及一种基于对比学习的自动化知识点识别方法与装置。本发明自行构建了计算机网络学科的数据集用于模型的训练与验证,以实现知识点分类的目的,并通过增强模型表现的训练方法提升模型在知识点分类任务中的表现;在对抗训练的基础上,在模型的训练过程中添加了对比学习的过程,能够通过学习样本的深层语义对模型的样本空间中各特征维度进行更深层次解释,以拓展样本空间中各维度表达的信息;通过在模型的训练过程中使用对比学习的方法,能够有效拉近相同知识点的句子在模型特征空间的距离,同时拉远不同知识点在特征空间中的距离,以提升模型表现。
-
公开(公告)号:CN115114930A
公开(公告)日:2022-09-27
申请号:CN202210554500.4
申请日:2022-05-19
Applicant: 北京理工大学 , 中国科学院信息工程研究所
Abstract: 本发明提出了一种基于序列到森林的非连续实体识别方法,为了更好地刻画实体内部组块之间的依赖性,使用森林结构建模文本中实体集;采用基于神经网络的“编码器‑解码器”生成框架,实现序列到森林的生成过程;在编码器端,首先采用基于Transformer的编码器捕获文本中每个词的全局依赖特征,然后再使用卷积神经网络进一步捕获词的局部依赖特征;在解码器端,设计了基于“便签”机制的注意力模块,可捕获每个解码时刻的输出与输入之间的语义关联性。本发明的有益效果是:可保证实体间的无序性以及实体内部的有效性,可有效捕获实体组块之间的关联性,可有效提高模型对非连续实体的识别能力,可适应于连续实体识别的场景。
-
公开(公告)号:CN110362817A
公开(公告)日:2019-10-22
申请号:CN201910480857.0
申请日:2019-06-04
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种面向产品属性的观点倾向性分析方法及系统。该方法主要包括:面向互联网产品评论数据集的预训练词嵌入模型;生成依赖产品属性的深层语义表示;基于词语空间信息和交互式注意力网络的识别影响产品属性观点倾向性的语义信息;面向产品属性的句子级观点倾向性分类器实现。另外实现了基于上述技术的面向产品评论的观点信息检索系统。本发明运用深度学习技术手段设计了依赖产品属性的深层语义表示,运用文本序列中词语的空间信息和交互式注意力网络,实现了面向产品属性的句子级观点倾向性分析方法,并运用上述相关技术实现了面向产品评论数据集的产品属性观点信息检索系统,提高了用户兴趣点(产品及产品属性)的观点信息精准查询。
-
公开(公告)号:CN104935963B
公开(公告)日:2018-03-16
申请号:CN201510290170.2
申请日:2015-05-29
Applicant: 中国科学院信息工程研究所
IPC: H04N21/258 , H04N21/466
Abstract: 本发明涉及一种基于时序数据挖掘的视频推荐方法。该方法包括:1)通过第三方数据分析用户对视频的兴趣梯度变化,并得到用户兴趣梯度曲线,将用户兴趣梯度曲线的奇异点作为用户兴趣迁移的时间点;2)确定用户最近的兴趣迁移时间点,对用户最近的兴趣迁移时间点以后的用户‑项目评分进行采集,从而建立选定时间窗口内的符合用户当前兴趣的用户‑项目评分矩阵;3)基于所述用户‑项目评分矩阵,通过使用随机游走模型进行用户的个性化视频推荐。本发明考虑了个性化视频推荐中的兴趣迁移问题,并融合了时间窗口方法和基于Random Walker的信任度模型进行个性化视频推荐,提高了视频推荐的准确性和效率。
-
公开(公告)号:CN104935963A
公开(公告)日:2015-09-23
申请号:CN201510290170.2
申请日:2015-05-29
Applicant: 中国科学院信息工程研究所
IPC: H04N21/258 , H04N21/466
CPC classification number: H04N21/25891 , H04N21/4667 , H04N21/4668
Abstract: 本发明涉及一种基于时序数据挖掘的视频推荐方法。该方法包括:1)通过第三方数据分析用户对视频的兴趣梯度变化,并得到用户兴趣梯度曲线,将用户兴趣梯度曲线的奇异点作为用户兴趣迁移的时间点;2)确定用户最近的兴趣迁移时间点,对用户最近的兴趣迁移时间点以后的用户-项目评分进行采集,从而建立选定时间窗口内的符合用户当前兴趣的用户-项目评分矩阵;3)基于所述用户-项目评分矩阵,通过使用随机游走模型进行用户的个性化视频推荐。本发明考虑了个性化视频推荐中的兴趣迁移问题,并融合了时间窗口方法和基于Random Walker的信任度模型进行个性化视频推荐,提高了视频推荐的准确性和效率。
-
公开(公告)号:CN115269925A
公开(公告)日:2022-11-01
申请号:CN202210724045.8
申请日:2022-06-23
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901
Abstract: 本发明公开了一种基于层次结构的无偏置场景图生成方法。本方法为:1)利用有偏模型对图像样本进行处理,得到有偏模型预测结果;根据各图像样本对应的所述有偏模型预测结果构建一层次化关系树;其中,所述有偏模型为场景图生成模型;2)根据所述层次化关系树和设定的层次化关系损失函数,计算损失值;然后基于所述损失值利用梯度反向传播方法优化所述有偏模型,使所述有偏模型输出结果迭代优化,最终输出无偏置场景图;3)对于一待处理的图像,将其输入步骤2)优化后的所述有偏模型,得到对应的无偏置场景图。本发明能够让模型由粗到细地学习不同关系间的区别,从高度有偏的长尾场景图数据中生成无偏置场景图。
-
公开(公告)号:CN113254576B
公开(公告)日:2022-07-26
申请号:CN202110453104.8
申请日:2021-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/216 , G06F40/30 , G06N5/02
Abstract: 本发明公开了一种人类行为与情感的预测、溯源方法及装置,对情感、需求和行为三者关联关系进行统一建模,可以从认知的角度通过情感、需求和行动之间的关系来模拟个体活动,实现了情感预测、情感溯源、行为预测及行为溯源四个任务。本发明可以对文本内容进行初步有效的情感预测和溯源以及行为预测和溯源,更好地揭示需求、情感和行为之间的本质关系,有助于研究人员追踪情绪反应和行为的起源,并为分析提供更合理的解释。
-
公开(公告)号:CN110363282B
公开(公告)日:2021-10-26
申请号:CN201910489364.3
申请日:2019-06-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于图卷积网络的网络节点标签主动学习方法和系统。该方法包括:1)根据当前带标签节点集合L,采用图卷积网络GCN预测本轮迭代中各节点的标签;2)根据GCN的分类效果更新待标注节点的查询策略,根据查询策略获得相应的待标注节点;3)将根据查询策略得到的待标注节点进行集成,从本轮迭代中的不带标签节点集合U中选出最优的待标注节点进行标注,并加入带标签节点集合L中;4)迭代进行步骤1)~3),直到标注的节点数目达到预先设置的目标数目。所述查询策略包括标签覆盖率查询策略、信息熵查询策略、节点中心性查询策略、信息密度查询策略。本发明能够改善和解决图卷积网络当带标签节点过少时参数更新困难的问题。
-
公开(公告)号:CN113254575A
公开(公告)日:2021-08-13
申请号:CN202110441185.X
申请日:2021-04-23
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多步证据推理的机器阅读理解方法与系统。本方法的步骤包括:1)将文章P和问题Q输入全局编码器,生成输入字符向量表示U;2)对U进行编码得到输入表示g并输入多步证据推理机;3)多步证据推理机根据g进行推理得到与问题Q相关的的开始证据向量和结束证据向量;4)根据多步证据推理机最终计算得到的与问题Q相关的起始证据向量sT+1、结束证据向量eT+1和问题的表达向量qcls计算问题Q的分值score,当分值score高于设定阈值θ,则判定该问题Q不可回答;否则判定该问题Q存在答案,并抽取从文章P中获取答案的开始位置start‑position和结束位置end‑position。
-
-
-
-
-
-
-
-
-