-
公开(公告)号:CN111047448A
公开(公告)日:2020-04-21
申请号:CN201911392756.4
申请日:2019-12-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了多通道数据融合的分析方法,包括:根据恶意数字货币地址为种子,从暗网中爬取交易数据,所述交易数据包括交易地址及交易内容;将具有相同身份标识的交易地址的交易内容合并;结合区块链交易流分析和明网数据分析,对交易地址的身份标识进行信息补充。本发明还提供了多通道数据融合的分析装置。本发明通过对互联网和暗网信息进行关联分析,能有效弥补主被动分析方法的问题。
-
公开(公告)号:CN110443476A
公开(公告)日:2019-11-12
申请号:CN201910667446.2
申请日:2019-07-23
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于知识标注评价的任务分配方法,其特征在于,包括:对标注员往期标注任务进行评分,并按任务完成时段及按任务类型将综合分数存储于标注员人物库中;根据待分配任务的类型和任务发布时间所属时段检索标注员人物库,筛选综合分数高于预定阈值的标注员,并从中选出已分配任务量最少的标注员,向其下发待分配任务。本发明公开了一种基于知识标注评价的任务分配系统。本发明在任务分配时综合利用标注员评价结果,根据知识库类型、业务方向、标注效果等维度建立任务分配策略,将新的标注任务自动分配给合适的标注员,提升任务分配的效率及知识标注的整体质量。
-
公开(公告)号:CN110209815A
公开(公告)日:2019-09-06
申请号:CN201910435240.7
申请日:2019-05-23
Applicant: 国家计算机网络与信息安全管理中心 , 北京天润基业科技发展股份有限公司
Abstract: 本发明公开一种卷积神经网络的新闻用户兴趣挖掘方法:步骤一:定义兴趣标签;步骤二:训练数据构造;步骤三、词向量的语料收集与词向量训练;步骤四、构造word到token和token到word的映射,得到映射表;步骤五、在映射表基础上,对原始文本进行转换;步骤六:加载预训练好的词向量文件,构造一个词典词汇数量vocab_size*词向量维度embedding_size大小的矩阵;步骤七:将带有兴趣标签的微博文本数据接入到分类模型训练。本发明实现了一种自动构造新闻用户兴趣标签的方法,通过构建一个结合连续的语义特征CNN卷积神经网络作为兴趣文本分类器,对用户的新闻评论进行兴趣分类,得到用户的兴趣。
-
公开(公告)号:CN106126606B
公开(公告)日:2019-08-20
申请号:CN201610453319.9
申请日:2016-06-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/2458 , G06F16/33
Abstract: 本发明公开了一种短文本新词发现方法。本方法为:1)从当前短文本中提取一字符串s,计算该字符串s的对称条件概率SCP(s)以及该字符串s的左邻熵HL(s)和右邻熵HL(s);2)取左邻熵HL(s)和右邻熵HL(s)的较小值,记为BE(s);3)计算该字符串s的成词概率Prword(s),根据Prword(s)的值确定词s是否为新词。本发明大大提高了新词发现的准确率。
-
公开(公告)号:CN109388768A
公开(公告)日:2019-02-26
申请号:CN201811008673.6
申请日:2018-08-31
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明涉及一种基于附加分支处理服务的采集方法和系统,包括:获取采集任务,该采集任务具有多个处理步骤和分支号;依次执行该采集任务中的处理步骤,并在每一个处理步骤执行前,根据该分支号判断是否调用该附加分支处理服务,若是,则通过调用该附加分支处理服务执行附加处理流程,并替代将要执行的处理步骤,否则执行将要执行的处理步骤。由此,本发明采用附加分支的技术,能够应对信源的各种复杂情况。且针对附加分支单独开发,容易崩溃的情况,采用服务化方法执行附加分支,并且附加分支运行器可以在崩溃自动重启,可以避免附加分支崩溃带来的采集器崩溃问题。
-
公开(公告)号:CN109241483A
公开(公告)日:2019-01-18
申请号:CN201811008674.0
申请日:2018-08-31
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明涉及一种基于域名推荐的网站发现方法,包括:在域名字符集随机选取任意字符排列组合以获得词根字符串;以该词根字符串组成候选字符串;将该候选字符串与候选域名后缀进行拼接,组成推荐域名;对该推荐域名进行DNS解析,以判断为合法的该推荐域名为合法域名;验证该合法域名是否存在对应网站,若存在则获取为目标网站。
-
公开(公告)号:CN108804527A
公开(公告)日:2018-11-13
申请号:CN201810400819.5
申请日:2018-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
Abstract: 本发明公开了一种基于微信区域朋友圈数据分析系统,包括:账户采集模块,账户消重模块,账户存储模块;信息采集模块,用于连续多次采集该限定区域内的朋友圈可见信息;信息消重模块,过滤掉该限定区域内在该次采集的朋友圈可见信息中以前已经出现过的朋友圈可见信息,得到新的朋友圈可见信息;信息存储模块,用于接收并储存新的朋友圈可见信息。本发明还公开了一种基于微信区域朋友圈数据分析方法。本发明实现了对限定区域内的所有微信用户的朋友圈可见信息进行了全面的分析,及时监测舆情,有效预警突发事件,防患于未然。
-
公开(公告)号:CN108429649A
公开(公告)日:2018-08-21
申请号:CN201810244277.7
申请日:2018-03-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L12/24
CPC classification number: H04L41/0631 , H04L41/064
Abstract: 本发明公开了一种基于多次单类型采集结果的综合异常判断系统,涉及网络预警技术领域。所述系统包括:阈值生成单元和异常判断单元;所述阈值生成单元,在从被采集系统上获取到的采集数据的基础上,计算判断阈值;所述异常判断单元,在所述判断阈值和所述采集数据的基础上,判断被采集系统运行是正常还是异常。本发明所述系统对采集到的数据进行多种方式进行判断,从而在不接触被监测系统后台日志或硬件数据的情况下准确识别出被检测系统的运行状况,解决了因使用平均值计算抗干扰性太弱,固定阈值判断性能太差,阈值波动范围设置方案单一且低效的问题。
-
公开(公告)号:CN104778209B
公开(公告)日:2018-04-27
申请号:CN201510111752.X
申请日:2015-03-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种针对千万级规模新闻评论的观点挖掘方法。具体步骤如下:1)、统计千万级规模新闻评论的数量;2)、判断该数量是否大于或等于阈值K,如果是不予处理,否则进入步骤三;3)、利用中文分词工具,对数量小于阈值K的新闻标题和评论进行分词,进行词性标注;4)、根据分词结果对新闻评论聚类,得到类别标签;5)、对新闻评论进行关键词对提取;6)、统计新闻评论的比例和混杂度;7)、根据关键词对筛选并提取代表性文本。本发明利用中文分词工具,考虑汉语语言的用法和搭配关系,结合新闻标题的作用,处理千万级规模的新闻评论,具有高效性、鲁棒性和易用性等优点。
-
公开(公告)号:CN106503859A
公开(公告)日:2017-03-15
申请号:CN201610963409.2
申请日:2016-10-28
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于在线社会关系网络的消息传播预测方法及装置,涉及社交媒体及大数据技术领域,该方法包括步骤1,对于一条消息d,获取其发出后在[0,T]时间段内,用户对其关注行为到达的时间序列;步骤2,对所述时间序列进行建模,对建模生成的模型进行学习,训练出所述模型的模型参数,根据所述模型参数,获取消息流行度预测函数。本发明能够应对数据涌发现象;通过MAPE对比,该方法准确率更高;形式灵活,可以应用到其他应用场景。
-
-
-
-
-
-
-
-
-