-
公开(公告)号:CN106940732A
公开(公告)日:2017-07-11
申请号:CN201710212983.9
申请日:2017-04-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种面向微博数据的疑似水军发现方法,属于计算机应用技术领域。本发明共分为以下六个步骤,分别为相关微博数据的采集;数据预处理;用户特征提取;构建训练集;训练水军检测模型;预测判别未标注数据。对比现有技术,本发明实现了数据的充分利用,方便快捷的进行群体发现而不用建立复杂的分类检测模型,从而降低了算法的复杂度,并且算法的模块性较高,可以投入大规模数据计算,具有较高的稳定性;本发明除了可以对单一用户进行水军检测,还可以对某一特定事件中的一批用户进行识别,该方法模块性极强,可以稳定适用于大规模数据计算框架下。
-
公开(公告)号:CN108563686B
公开(公告)日:2021-07-30
申请号:CN201810208801.5
申请日:2018-03-14
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明涉及计算机技术领域,具体提供了一种基于混合神经网络的社交网络谣言识别方法及系统,旨在解决如何在考虑谣言转发评论信息的情况下,准确识别社交网络中谣言的技术问题。为此目的,本发明中社交网络谣言识别方法,首先利用三种不同的神经网络分别获取用户特征向量、原文特征向量和传播信息特征向量,然后将用户特征向量、原文特征向量和传播信息特征向量融合为新的特征向量,最后利用第四种神经网络对融合后的特征向量进行谣言识别。基于上述步骤,能够快速且准确地检测到社交网络中的谣言。同时,本发明中的系统能够执行并实现上述步骤。
-
公开(公告)号:CN107577782B
公开(公告)日:2021-04-30
申请号:CN201710827978.9
申请日:2017-09-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F16/33 , G06F16/9535
Abstract: 本发明公开了一种基于异质数据的人物相似度刻画方法,属于数据挖掘领域。本发明首先搜集用户的微博文本,获取用户之间的关注关系以及各用户的基本信息,针对不同类型数据的特点个性化选择处理方式,并对于微博文本采用Doc2vec模型,结合上下文信息将文本表示成向量,再根据定义的相似度函数衡量相似度,最后将不同维度得到的矩阵进行融合,刻画用户最终的相似度。本发明引入了多种社交网络信息,包括社交关系数据、用户属性数据和用户文本数据等,通过对不同类型的信息加以综合考虑,以得到更全面的人物相似度刻画方法;同时本发明提供了对于多种数据的处理和计算方案,利用完整的数据和加权融合方法,个性化计算不同偏好的人物相似度。
-
公开(公告)号:CN106168969B
公开(公告)日:2019-05-14
申请号:CN201610524367.2
申请日:2016-07-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明提供一种信源重要度的评级方法及评级系统,评级方法包括:步骤1,计算信源所属网站的网站重要度值W1;步骤2,计算信源在所属行业的行业重要度值W2;步骤3,预设定网站重要度权重值C1和行业重要度权重值C2;根据下式计算得到信源重要度值M:信源重要度值M=网站重要度值W1*网站重要度权重值C1+行业重要度值W2*行业重要度权重值C2;步骤4,根据信源重要度值M对信源进行重要度评级,并输出信源重要度评级结果。优点为:本发明能够对信源进行客观、科学合理、有效实用的信源重要度评级。
-
公开(公告)号:CN108846017A
公开(公告)日:2018-11-20
申请号:CN201810426304.2
申请日:2018-05-07
Applicant: 国家计算机网络与信息安全管理中心 , 北京天润基业科技发展股份有限公司
Abstract: 本发明一种基于Bi-GRU和字向量的大规模新闻文本的端到端分类方法,包括如下步骤:S1.进行Word Embedding的字级别语义特征表示;S2.构建注意力权重的Bi-GRU字级别的句子特征编码模型;S3.搭建基于注意力权重的Bi-GRU句子级别特征编码模型;S4.使用分层Softmax实现端到端分类实现。本发明方法可降低向量的维度,且有效地防止特征过于稀疏问题。优化了最终的输出向量,增强了模型特征编码有效性。避免维度过高造成的模型难以训练问题,又提供了额外的语义信息。可灵活组合特征抽取模型和各种常见分类器,方便更换调试分类器。计算复杂度比Softmax从|K|降低到log|K|。
-
公开(公告)号:CN108805254A
公开(公告)日:2018-11-13
申请号:CN201810393788.5
申请日:2018-04-27
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06N3/00
CPC classification number: G06N3/006
Abstract: 本发明属于时序预测技术领域,具体提供了一种时序预测的参数优选系统,旨在解决现有技术对先验知识要求高、可拓展途径较低、时间复杂度高、实际可行度低以及鲁棒性差的技术问题。为此目的,本发明提供的参数优化系统包括参数优化模块,参数优化模块配置为基于预先构建的参数优化模型对预先获取的时序预测模型进行参数优化。其中,参数优化模块包括空间调控单元以及收敛调控单元;空间调控单元配置为基于第一权重函数调控参数优化模块的空间搜索范围;收敛调控单元配置为基于第二权重函数调控参数优化模块的收敛速率。本发明的系统增加了分布式表现,各个个体可以高效交流、协作,且提高了算法的性能。
-
公开(公告)号:CN108763319A
公开(公告)日:2018-11-06
申请号:CN201810396753.7
申请日:2018-04-28
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
CPC classification number: G06Q50/01 , G06N3/0454
Abstract: 本发明属于计算机技术领域,具体提供了一种融合用户行为和文本信息的社交机器人检测方法和系统。旨在解决现有技术手动选取特征、忽略社交媒体帖子之间的逻辑性和时序性以及忽略社交平台用户行为信息的问题,本发明的社交机器人的检测方法包括获取待检测社交媒体用户的历史网络数据和好友网络数据;基于上述数据得到用户文本特征向量、行为特征向量以及好友网络特征向量,并将其融合,得到待检测社交媒体用户的用户特征向量;对用户特征向量进行检测,输出检测结果。本发明的方法更加符合社交媒体自身的特性,从多个维度分析待检测社交媒体用户,提升了检测准确率。本发明的系统同样具有上述有益效果。
-
公开(公告)号:CN108334495A
公开(公告)日:2018-07-27
申请号:CN201810090296.9
申请日:2018-01-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种短文本相似度计算方法,包括以下步骤:S1、对训练语料进行分词,利用word2vec算法得到每个词的词向量,并组合形成词向量集合;S2、分别对待计算短文本进行分词,在词向量集合中找到待计算短文本的每个词语的词向量,并组合形成短文本向量集合;S3、计算词向量集合中每个词向量与短文本向量集合中每个词向量的余弦相似度,并得到每个词向量的最大相似度值组合得到短文本句子向量;S4、计算两个短文本句子向量间的相似度,即可计算两个短文本间的相似度。本发明还提供了一种短文本相似度计算系统。本发明的相似度算法通过将短文本句子以句子向量表示,有效的刻画了短文本句子之间的语义相似度,准确率高。
-
公开(公告)号:CN105808525B
公开(公告)日:2018-06-29
申请号:CN201610186810.X
申请日:2016-03-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明提供一种基于相似概念对的领域概念上下位关系抽取方法,包括以下步骤:步骤1,领域概念集合由若干个领域概念组成;基于概念聚类的方法从领域概念集合中抽取相似的领域概念;步骤2,获得可能存在上下位关系的候选概念对,然后根据步骤1获取的相似概念产生相似候选概念对;步骤3,利用知识库获取部分训练数据,并通过相似候选概念对共同表征关系特征,实现基于多句特征的关系抽取,从而抽取到领域概念上下位关系。优点为:本发明可以突破语料规模的限制,利用多句特征抽取领域概念的上下位关系,可提升领域概念上下位关系抽取的准确率。
-
公开(公告)号:CN107633044A
公开(公告)日:2018-01-26
申请号:CN201710827984.4
申请日:2017-09-14
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于热点事件的舆情知识图谱构建方法,属于自然语言处理领域;首先实时获取微博文本,对每个微博文本进行处理,构建文本簇,计算每个文本簇所属的话题类别,按类别识别每个簇中的热点事件,统计每个热点事件的多维属性;识别参与热点事件讨论的重要人物和机构,并获取重要人物和机构的多维属性;最后构建事件、人物、机构的多维属性体系及关系类型,以事件、人物、机构为实体,事件、人物、机构之间的关系为关联,构建舆情知识图谱。本发明能够从多个维度对热点事件、人物、机构进行刻画,实现对热点事件、人物、机构的全方位解析;并根据实际需求,设置不同话题类别的权重,实现不同话题的舆情知识图谱构建。
-
-
-
-
-
-
-
-
-