-
公开(公告)号:CN111737551B
公开(公告)日:2022-08-05
申请号:CN202010452949.0
申请日:2020-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/951 , G06N3/08 , G06N3/04
Abstract: 本发明公开一种基于异构图注意力神经网络的暗网线索检测方法:步骤一、对暗网进行文本采集;步骤二、针对采集到的暗网文本信息,进行事件标题、关键词及实体提取,构建动态异构信息网络;步骤三、对构建的异构信息网络中的节点进行embedding处理,并得到各节点的特征向量;步骤四、对异构信息网络的图结构进行学习;步骤五、根据对异构信息网络的图结构学习得到的结果,对异构信息网络中的节点进行线索类别分类,从而完成对暗网信息的线索检测。本发明利用了外部知识库作为依托,并且采用了两套方法来对构建的异构信息网络的图结构进行学习,具有良好的线索检测效果。
-
公开(公告)号:CN110427264B
公开(公告)日:2021-11-30
申请号:CN201910578638.6
申请日:2019-06-28
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F9/50 , G06F16/951
Abstract: 本发明提出一种基于Kubernetes的JS解析方法及系统,包括:多台物理机、采集结果库、系统监控模块和解析任务控制模块;物理机,用于根据任务部署JS解析Pod,执行网页采集,将得到的采集结果存至采集结果库;系统监控模块,用于自动读取物理机的机器信息;解析任务控制模块,用于查询系统监控模块,得到各物理机的机器信息,以计算各物理机应部署的JS解析Pod个数,调用Kubernetes API调整各物理机的JS解析Pod个数。本发明有效的利用了空闲时间执行JS解析相关任务,并减小了JS解析的资源消耗。
-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN111832622A
公开(公告)日:2020-10-27
申请号:CN202010531569.6
申请日:2020-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种特定人物丑化图片识别方法和系统,包括:获取包含特定人物的图片集,该图片集包括多张漫画和多张照片,该图片集中每张图片标有代表是否丑化的预设标签,以该图片集中漫画和照片分别作为训练数据,训练卷积神经网络模型,得到特定人物漫画识别网络和特定人物照片识别网络;通过前置网络判断待识别图片是否属于漫画,若是,则将该待识别图片发送至该特定人物漫画识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则对该待识别图片进行人脸对比,判断该待识别图片是否包括该特定人物,若是则通过该特定人物照片识别网络,得到该待识别图片的特定人物丑化图片识别结果,否则得到该待识别图片不包括该特定人物的识别结果。
-
公开(公告)号:CN111832621A
公开(公告)日:2020-10-27
申请号:CN202010531567.7
申请日:2020-06-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于稠密多路卷积网络的图片分类方法和系统,包括:构建由分组、变换、聚合构成的基本单元,基于该基本单元构建新的稠密模块,将密集连接的卷积DenseNet网络网络框架中原始稠密模块替换为该新稠密模块,得到稠密多路卷积网络;使用已标记类别的图片数据作为训练数据,通过梯度反向传播更新该稠密多路卷积网络中的权重,训练该稠密多路卷积网络,得到图片分类模型;将待分类图片数据输入该分类模型,得到该待分类图片数据的分类结果。本发明提出的稠密多路卷积网络,对DenseNet网络的基本模块进行了改进和优化,以获取表达力更强的特征。
-
公开(公告)号:CN111597333A
公开(公告)日:2020-08-28
申请号:CN202010343965.6
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9535 , G06F40/30 , G06F40/289 , G06Q50/26
Abstract: 本发明公开一种面向区块链领域的事件与事件要素抽取方法及装置,该方法包括:步骤一、基于区块链关键词图的web文本聚类,得到区块链文本聚合词图;步骤二、基于所述的区块链文本聚合词图,构建图注意力机制的图表示学习的事件及其要素抽取方法;首先以区块链文本聚合词图作为输入,基于图注意力模型GAT的深度学习模型进行词的表示学习,以事件及其要素进行抽取的模型训练直到模型收敛;基于收敛的模型实现Tensorflow的后台接口,而对于新的待抽取的文本通过该后台接口进行预测,返回输出的抽取值。本发明可以准确提取事件及其事件要素。
-
公开(公告)号:CN110427264A
公开(公告)日:2019-11-08
申请号:CN201910578638.6
申请日:2019-06-28
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F9/50 , G06F16/951
Abstract: 本发明提出一种基于Kubernetes的JS解析方法及系统,包括:多台物理机、采集结果库、系统监控模块和解析任务控制模块;物理机,用于根据任务部署JS解析Pod,执行网页采集,将得到的采集结果存至采集结果库;系统监控模块,用于自动读取物理机的机器信息;解析任务控制模块,用于查询系统监控模块,得到各物理机的机器信息,以计算各物理机应部署的JS解析Pod个数,调用Kubernetes API调整各物理机的JS解析Pod个数。本发明有效的利用了空闲时间执行JS解析相关任务,并减小了JS解析的资源消耗。
-
公开(公告)号:CN109977227A
公开(公告)日:2019-07-05
申请号:CN201910205999.6
申请日:2019-03-19
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于信息分类领域,具体涉及了一种基于特征编码的文本特征提取方法、系统、装置,旨在解决文本特征提取中运算复杂度高、分类效率和精度低的问题。本发明方法包括:对获取的文本预处理,获得词候选特征序列;基于词候选特征序列,生成多个二进制编码;采用基因遗传算法筛选二进制编码,获得最优二进制编码;解码最优二进制编码获得最优词特征序列并输出。本发明将一系列候选特征转化为易处理的编码序列,并使用基因遗传算法的自动筛选功能,对特征进行最大化的全局最优挑选,能够有效地筛选出最小有效特征集。
-
公开(公告)号:CN107239704A
公开(公告)日:2017-10-10
申请号:CN201710374994.7
申请日:2017-05-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F21/56
CPC classification number: G06F21/562
Abstract: 本发明公开了一种恶意网页发现方法及装置,所述方法包括:确定每个预先选取的低可信度用户的网页资源访问集合;从确定的访问集合中确定出所有低可信度用户的网页资源访问交集;对所述访问交集中网页资源进行恶意网页检测,根据检测结果,确定恶意网页。本发明有效地解决现有恶意网页分类技术易漏判、准确率低和效率低的问题。
-
公开(公告)号:CN119719797A
公开(公告)日:2025-03-28
申请号:CN202411760482.0
申请日:2024-12-03
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06Q50/00 , G06F18/213 , G06V30/148
Abstract: 本发明公开了社交网络相似账号识别方法,包括:S1:获取至少两个待识别账号的言论数据;S2:提取所述言论数据的语义特征,计算内容相似度;S3:提取所述言论数据的位置信息,计算位置相似度;S4:提取所述言论数据的发布时间信息,计算时间相似度;S5:计算至少两个所述待识别账号的基本信息相似度;S6:根据所述内容相似度、所述位置相似度、所述时间相似度和所述基本信息相似度判断至少两个所述待识别账号是否为相似账号。本发明还提供了识别装置。本发明能够较准确地识别社交网络上的相似账号。
-
-
-
-
-
-
-
-
-