-
公开(公告)号:CN111737590A
公开(公告)日:2020-10-02
申请号:CN202010442783.4
申请日:2020-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/33
Abstract: 本发明公开了社交关系挖掘方法、装置、电子设备以及存储介质。所述方法包括:获取群组的对话流数据;将所述对话流数据划分为多个对话队列,其中,各对话队列的时间跨度小于或等于时间阈值;根据各对话队列中对话信息的上下文相关度,确定构成真实对话场景的对话队列;提取所述构成真实对话场景的对话队列所对应的用户,作为具有社交关系的用户。基于该方法及装置,可以还原对话场景,进而更加精准地映射对话用户,挖掘用户社交关系。
-
公开(公告)号:CN111737551A
公开(公告)日:2020-10-02
申请号:CN202010452949.0
申请日:2020-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/951 , G06N3/08 , G06N3/04
Abstract: 本发明公开一种基于异构图注意力神经网络的暗网线索检测方法:步骤一、对暗网进行文本采集;步骤二、针对采集到的暗网文本信息,进行事件标题、关键词及实体提取,构建动态异构信息网络;步骤三、对构建的异构信息网络中的节点进行embedding处理,并得到各节点的特征向量;步骤四、对异构信息网络的图结构进行学习;步骤五、根据对异构信息网络的图结构学习得到的结果,对异构信息网络中的节点进行线索类别分类,从而完成对暗网信息的线索检测。本发明利用了外部知识库作为依托,并且采用了两套方法来对构建的异构信息网络的图结构进行学习,具有良好的线索检测效果。
-
公开(公告)号:CN111581370A
公开(公告)日:2020-08-25
申请号:CN202010310036.5
申请日:2020-04-20
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/335 , G06F16/951 , G06F16/9536 , G06F40/242 , G06Q10/06 , G06Q50/00
Abstract: 本发明公开了一种综合多通道数据来源的网络舆情热度评估方法,包括:步骤一、收集各通道的流数据;步骤二、量化流数据对于目标事件的敏感值和情绪标签;步骤三、基于敏感度和影响力量化得到主体指标值;步骤四、基于敏感消息数、各类情绪标签对应的消息数,量化得到内容指标值;步骤五、基于每日的消息数、用户数、群组数,量化得到传播指标值;步骤六、基于主体指标值、内容指标值、传播指标值,量化得到各通道的综合热度值,并计算得到目标事件当日的总热度值。本方法建立了普适的网络舆情热度评估指标体系,评估结果更准确全面。本发明还公开了一种综合多通道数据来源的网络舆情热度评估装置,本装置对网络舆情热度的评估更准确全面。
-
公开(公告)号:CN110413784A
公开(公告)日:2019-11-05
申请号:CN201910666645.1
申请日:2019-07-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于知识图谱的舆情关联分析方法,包括:提取互联网舆情知识中实体的属性和关系,基于知识图谱构建舆情业务知识库;确定需要关联分析的多个相同或不同类型的实体,采用相交、合并或者消减的方式对多个相同或不同类型的实体进行组合;确定多个相同或不同类型的实体每种组合方式进行关联分析的结果构成,得到分析结果。本发明还提供一种基于知识图谱的舆情关联分析系统。本发明可以实现包括特定人物、特定组织、特定事件、特定专题等在内的相同类型或不同类型知识的关联分析,并实现关联实体的多维度深度分析和关联挖掘,帮助业务用户准确掌握各类不同群体的关联情况,以及关联实体的全方位智能分析结果,进而辅助决策。
-
公开(公告)号:CN107818132A
公开(公告)日:2018-03-20
申请号:CN201710858063.4
申请日:2017-09-21
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30864 , G06F17/30887 , G06F17/30896 , G06F21/562 , G06F2221/2119
Abstract: 本发明提供一种基于机器学习的网页代理发现方法,步骤包括:通过爬虫主动获取代理及非代理的网页数据集;从所述网页数据集中分别抽取URL特征和DOM特征,根据该URL特征和/或DOM特征构建一含有多维特征的向量作为训练集;利用机器学习方法在所述训练集上构建模型并进行训练,通过训练出的模型进行网页代理识别。本发明基于爬虫捕获的URL和网页内容抽取特征,并构建模型进行训练,根据训练的模型识别出网页代理,识别的准确率、召回率及F1-score高。
-
公开(公告)号:CN105933324A
公开(公告)日:2016-09-07
申请号:CN201610391155.1
申请日:2016-06-03
Applicant: 中国科学院信息工程研究所
CPC classification number: H04L69/22 , H04L43/18 , H04L69/162
Abstract: 本发明涉及一种基于网络流在线实时分析跳转链和溯源的方法,其步骤包括:1)通过网络流捕获平台对HTTP网络流进行在线实时捕获;2)将捕获的网络流进行编码;3)将编码后得到的一系列HTTP会话发送给后端平台;4)后端平台对收到的网络流进行解码;5)后端平台基于解码后的网络流的HTTP协议头部的不同字段,计算每一次访问资源的跳转链,并从跳转链中发现相同资源的公共前置页面。本发明能从实时网络流中实时识别出各种音视频大文件访问的跳转链,并从中发现相同资源的公共前置页面。
-
-
-
-
-