-
公开(公告)号:CN106156150B
公开(公告)日:2019-06-25
申请号:CN201510175964.4
申请日:2015-04-14
Applicant: 北大方正集团有限公司 , 北京大学 , 国家计算机网络与信息安全管理中心 , 北京北大方正电子有限公司
IPC: G06F16/9535 , G06F16/332
Abstract: 本发明公开了一种微博用户关联信息筛选方法及装置,用以解决现有技术中存在的数据稀疏的问题,以及推荐效果不理想,降低系统推荐效率的问题,该方法包括:首先确定当前用户的关联用户集合、特征向量、以及社区结构和主题;根据该每一个关联用户对应的特征向量中的每一个特征项和每一个社区结构对应的主题,得到用户主题分布;根据用户主题分布,筛选出当前用户的目标关联用户,这样,可以避免了推荐结果数据稀疏的问题,提高了系统的推荐效率,并得到与当前用户的兴趣爱好一致的关联用户。
-
公开(公告)号:CN106156150A
公开(公告)日:2016-11-23
申请号:CN201510175964.4
申请日:2015-04-14
Applicant: 北大方正集团有限公司 , 北京大学 , 国家计算机网络与信息安全管理中心 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种微博用户关联信息筛选方法及装置,用以解决现有技术中存在的数据稀疏的问题,以及推荐效果不理想,降低系统推荐效率的问题,该方法包括:首先确定当前用户的关联用户集合、特征向量、以及社区结构和主题;根据该每一个关联用户对应的特征向量中的每一个特征项和每一个社区结构对应的主题,得到用户主题分布;根据用户主题分布,筛选出当前用户的目标关联用户,这样,可以避免了推荐结果数据稀疏的问题,提高了系统的推荐效率,并得到与当前用户的兴趣爱好一致的关联用户。
-
公开(公告)号:CN104699689A
公开(公告)日:2015-06-10
申请号:CN201310651479.0
申请日:2013-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种数据处理方法及装置,其中,方法包括:接收处理请求,所述处理请求包括待审课题的标识,待审单位信息和评审时间信息;根据所述处理请求,查询预先统计的各课题所属的研究领域和各用户的用户数据,确定所述各用户中的第一用户;将所述第一用户确定为所述待审课题的评审用户。通过本发明提供的数据处理方法及装置,无需人工进行筛选,快速准确地确定出评审待审课题的评审用户,进而节约人力物力资源,有效提高课题评审的效率。
-
公开(公告)号:CN104699689B
公开(公告)日:2018-04-27
申请号:CN201310651479.0
申请日:2013-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种数据处理方法及装置,其中,方法包括:接收处理请求,所述处理请求包括待审课题的标识,待审单位信息和评审时间信息;根据所述处理请求,查询预先统计的各课题所属的研究领域和各用户的用户数据,确定所述各用户中的第一用户;将所述第一用户确定为所述待审课题的评审用户。通过本发明提供的数据处理方法及装置,无需人工进行筛选,快速准确地确定出评审待审课题的评审用户,进而节约人力物力资源,有效提高课题评审的效率。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F17/16
Abstract: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN107992474B
公开(公告)日:2021-04-27
申请号:CN201711193285.5
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/284 , G06F16/2458 , G06F16/215
Abstract: 本发明涉及一种流式数据主题挖掘方法及其系统,该挖掘方法包括:对结构化数据进行筛选,得到主题数据,提取主题数据的主题实体和主题关键词,分别生成主题实体集合和主题关键词集合;提取候选新闻数据的新闻实体和新闻关键词,分别生成新闻实体集合和新闻关键词集合;分别计算得到实体相关度、关键词相关度和核心词相关度;计算候选新闻数据与主题数据的新闻主题相似度,并将新闻主题相似度大于预设阈值的候选新闻数据导入合格新闻数据集合。本发明能够从海量的实时流式数据中准确找到用户关注的特定主题的相关新闻,保证了该主题下新闻的实时性、准确性,以及该主题下新闻动态的变化过程,并对新闻内容进行了分析。
-
公开(公告)号:CN107992473B
公开(公告)日:2021-04-27
申请号:CN201711190871.4
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F16/35
Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。
-
公开(公告)号:CN110941721A
公开(公告)日:2020-03-31
申请号:CN201910928700.X
申请日:2019-09-28
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F16/31 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于变分自编码主题模型的短文本主题挖掘方法及系统。该方法充分利用神经网络结构的优点,在变分自编码主题模型中融入了预训练的词向量和知识图谱中的实体向量表示,可以帮助主题模型改善短文本特征稀疏导致的文本挖掘问题,较好地挖掘短文本的潜在语义信息。
-
公开(公告)号:CN107992473A
公开(公告)日:2018-05-04
申请号:CN201711190871.4
申请日:2017-11-24
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于逐点互信息技术的诈骗信息特征词提取方法及系统,该提取方法包括:提取诈骗信息主题关键词,组成主题关键词集合;将信息组中的信息按是否为诈骗信息划分为正样本集合和负样本集合,并得到正样本分词集合、负样本候分词集合和候选关键词集合;根据候选关键词集合的候选关键词在信息组的正相互性PMI值和负相互性PMI值得到候选关键词在信息组的权重,将权重大于预设阈值的候选关键词记为信息组的合格关键词。本发明通过对信息组中的信息进行处理,得到候选关键词集合,计算候选关键词相对于信息的正相互性PMI值和负相互性PMI值,得到候选关键词的权重,由此判断是否为合格关键词,实现了对数据流式信息的关键词提取。
-
公开(公告)号:CN106294334A
公开(公告)日:2017-01-04
申请号:CN201510236658.7
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种微博舆情指标体系的计算方法及装置。其中,该方法包括:构建微博舆情指标体系;其中,微博舆情指标体系包括:微博主体、微博信息、微博话题和微博舆情;计算微博主体的活跃度和影响力;计算微博信息的热度和影响力;计算微博话题的热度和影响力;基于计算结果得到微博舆情综合指数。本发明构建了微博舆情指标体系,并且基于微博舆情指标体系,可准确获取得到微博舆情综合指数。解决了相关技术中舆情分析指标体系过于庞大,针对性不强的问题。微博作为网络舆情的主要推动媒介,基于本发明研究的微博舆情指标体系,将能更加准确的评估社会舆情安全状态。
-
-
-
-
-
-
-
-
-