-
公开(公告)号:CN118014049A
公开(公告)日:2024-05-10
申请号:CN202410177798.0
申请日:2024-02-08
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC分类号: G06N3/09 , G06N3/0455 , G06F18/22 , G06F18/2431 , G06F40/30 , G06V20/70 , G06V10/40 , G06V10/82
摘要: 本发明提供一种图文互生模型的训练方法,该方法包括:基于模态自感单元从样本模态数据中提取自感信息;模态自感单元基于自注意力网络通过多任务有监督训练得到;基于图文编码器对自感信息进行编码,得到隐空间特征,并对隐空间特征进行多模态扩散处理,得到扩散后的目标模态类型的隐空间特征;基于图文解码器对自感信息和扩散后的目标模态类型的隐空间特征进行解码,得到解码信息;根据解码信息和多任务损失函数对图文编码器和图文解码器进行训练,得到图文互生模型;目标损失包括重建损失、图像类的理解辅助任务对应损失和文本类的理解辅助任务对应损失确定。本发明所述方法提高了图文互生对应模型的性能和可适配性。
-
公开(公告)号:CN116127964A
公开(公告)日:2023-05-16
申请号:CN202211600947.7
申请日:2022-12-13
IPC分类号: G06F40/284 , G06F40/30 , G06F16/35 , H04L9/40 , H04W12/12
摘要: 本发明公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
-
公开(公告)号:CN118585608A
公开(公告)日:2024-09-03
申请号:CN202410750428.1
申请日:2024-06-12
申请人: 国家计算机网络与信息安全管理中心 , 烟台中科网络技术研究所
IPC分类号: G06F16/33 , G06F16/35 , G06F18/2415 , G06F40/30 , G06F9/50
摘要: 本发明涉及人工智能进行自然语言处理技术领域,尤其涉及一种短文本智能分析与分类优化方法,包括以下步骤:S1:对短文本信息进行初步处理,得到初步处理后的短文本信息;S2:引入均衡负载数据分片算法将初步处理后的短文本信息进行数据分片并存储至多个节点k,利用分布式分散处理算法实现数据并行处理;S3:引入语境深度理解算法,优化短文本信息分类的准确率;S4:各节点k利用优化自然语言处理算法对分得的短文本分片数据进行智能分析,并确定其所属类别;S5:汇总并分析全部节点k上的分类结果,得到短文本信息的最终分析与分类结果,本方法提高了短文本信息处理分析与分类中的效率及准确率。
-
公开(公告)号:CN117591119B
公开(公告)日:2024-05-31
申请号:CN202311441226.0
申请日:2023-11-01
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。
-
公开(公告)号:CN116962996A
公开(公告)日:2023-10-27
申请号:CN202311222480.1
申请日:2023-09-21
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04W4/12 , H04W4/08 , H04L51/063 , H04L51/214 , H04L51/52 , H04L51/56 , G06N3/006
摘要: 本发明提供一种基于粒子群算法的信息传播预测方法、装置和设备,属于信息处理技术领域,该方法包括:确定在第一时刻目标信息对应的各个类型的用户的数量;其中,各个类型的用户对目标信息的信任程度和/或传播方式不同;根据第一时刻目标信息对应的各个类型的用户的数量和信息传播模型,确定目标信息的传播预测结果;目标信息的传播预测结果中包括在第二时刻目标信息对应的各个类型的用户的数量;信息传播模型用于对信息在传播过程中各个类型用户数量的变化情况进行预测。本发明的方法实现了对目标信息传播过程中各类型用户数量变化情况的准确预测,提升了信息传播预测结果的准确性。
-
公开(公告)号:CN113674142B
公开(公告)日:2023-10-17
申请号:CN202111003756.8
申请日:2021-08-30
申请人: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
IPC分类号: G06T3/00 , G06N3/0464 , G06N3/08 , G06V10/762
摘要: 本发明实施例公开了一种图像中目标物的消融方法、装置、计算机设备及介质。该方法包括:获取多个训练样本图像,并根据各训练样本图像中预先标注的标识框的长宽值和DIou损失函数的损失值,计算得到至少一个锚点框的长宽值;根据各锚点框的长宽值,对YoLoV5改进模型进行参数设置,并使用各训练样本图像对参数设置后的模型进行训练,得到目标检测模型;将待处理的目标图像输入至目标检测模型中,获取针对目标图像输出的至少一个目标物标识框;根据目标物标识框所限定的图像区域进行消融处理,得到目标消融图像。通过本发明实施例的技术方案,能够实现快速准确地对图像中的特定内容进行定位消融,提高了方法的运行效率,节约了硬件成本。
-
公开(公告)号:CN116611433A
公开(公告)日:2023-08-18
申请号:CN202310478295.2
申请日:2023-04-28
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/289 , G06Q10/0639 , G06F18/24 , G06N3/0464 , G06N20/00
摘要: 本发明实施例涉及一种情感识别方法及系统,所述方法包括:获取目标文本对应的初始数据,所述初始数据是由所述目标文本经过预处理得到的;设定所述初始数据的细粒度规则,得到所述初始数据对应不同长度的类别文本;根据所述细粒度规则和所述类别文本,确定不同长度的所述类别文本对应的不同类别的情感识别模型;将所述类别文本输入到对应的所述情感识别模型中进行识别处理,得到所述目标文本的情感识别结果。通过对获得到初始数据按照设定的细粒度规则进行设定分类,确定情感识别模型,通过识别处理得到情感识别结果,由此,可以更加准确地表达和识别用户的情感倾向和理解用户情感,更好地支持情感分析应用,更好地支持舆情分析,实现对短文本的情感识别处理的技术效果。
-
公开(公告)号:CN115292571B
公开(公告)日:2023-03-28
申请号:CN202210942548.2
申请日:2022-08-08
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/951 , G06F16/215 , G06F8/61 , G06F9/445 , G06F17/18 , G06V10/74 , G06V10/764
摘要: 本发明公开了一种App数据采集方法及系统,所述方法包括对群控平台中所有应用软件进行遍历采集,得到群控平台应用软件信息;对群控平台应用软件中的内容进行深度优先遍历采集,并将获取的内容进行整合;对整合后的采集内容进行判断清洗,获得最终应用软件通用内容。通过采用改进的深度优先遍历算法完成采集工作,保证了采集数据的全面性,同时提高了采集效率。
-
公开(公告)号:CN115269834A
公开(公告)日:2022-11-01
申请号:CN202210782688.8
申请日:2022-06-28
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
摘要: 本发明公开了一种基于BERT的高精度文本分类方法及装置,在输入端采用FastText模型,对词汇进行嵌入表示得到表示向量,然后把表示向量作为BERT模型的输入,将BERT的输出结果接上全连接层+softmax,实现文本分类。本发明提前用FastText模型处理语料数据,获取字符的特征,解决了OOV的embedding问题,同时获取词的形态变换,对富有词型变换的语料具有更好的表示能力;使用BERT能够提前预训练大量的语料,增加了词向量的语义丰富度,获得更好的上下文表示;在BERT模型的输出添加全连接层和softmax进行文本分类,提高了文本分类的精度。
-
公开(公告)号:CN115190217A
公开(公告)日:2022-10-14
申请号:CN202210801788.0
申请日:2022-07-07
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种融合自编码网络的数据安全加密方法和装置,涉及互联网数据处理技术领域。本发明为了解决现有数据安全加密时面对包含大量图片的海量数据存储资源开销大、数据传输不安全、数据传输效率低的缺陷,其方法为采用文本加密模块对文本类型数据作加密处理,构建图片自编码网络模型,采用图片压缩模块对待加密的原始图片类型数据作预压缩处理;采用图片加密模块对图片压缩编码作加密处理,采用解密模块对需要应用于下游任务的文本密文数据或图片密文数据进行解密,采用图片重建模块对解密后的图片压缩编码进行重建复原,译码器将码字通过重建处理后得到重建图片类型数据。本发明主要用于海量数据传输。
-
-
-
-
-
-
-
-
-