-
公开(公告)号:CN115292571B
公开(公告)日:2023-03-28
申请号:CN202210942548.2
申请日:2022-08-08
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/215 , G06F8/61 , G06F9/445 , G06F17/18 , G06V10/74 , G06V10/764
Abstract: 本发明公开了一种App数据采集方法及系统,所述方法包括对群控平台中所有应用软件进行遍历采集,得到群控平台应用软件信息;对群控平台应用软件中的内容进行深度优先遍历采集,并将获取的内容进行整合;对整合后的采集内容进行判断清洗,获得最终应用软件通用内容。通过采用改进的深度优先遍历算法完成采集工作,保证了采集数据的全面性,同时提高了采集效率。
-
公开(公告)号:CN115190217A
公开(公告)日:2022-10-14
申请号:CN202210801788.0
申请日:2022-07-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种融合自编码网络的数据安全加密方法和装置,涉及互联网数据处理技术领域。本发明为了解决现有数据安全加密时面对包含大量图片的海量数据存储资源开销大、数据传输不安全、数据传输效率低的缺陷,其方法为采用文本加密模块对文本类型数据作加密处理,构建图片自编码网络模型,采用图片压缩模块对待加密的原始图片类型数据作预压缩处理;采用图片加密模块对图片压缩编码作加密处理,采用解密模块对需要应用于下游任务的文本密文数据或图片密文数据进行解密,采用图片重建模块对解密后的图片压缩编码进行重建复原,译码器将码字通过重建处理后得到重建图片类型数据。本发明主要用于海量数据传输。
-
公开(公告)号:CN114978585A
公开(公告)日:2022-08-30
申请号:CN202210380490.7
申请日:2022-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京赋乐科技有限公司
Abstract: 本公开的实施例提供了基于流量特征的深度学习对称加密协议识别方法、装置、设备和计算机可读存储介质。所述方法包括获取网络流量数据;对所述网络流量数据进行预处理,得到对称加密流量;基于主成分分析‑皮尔森系数法流量识别模型和基于注意力机制的CNN‑LSTM算法流量识别模型,构建基于流量特征的对称加密协议识别模型;将所述对称加密流量,输入至所述基于流量特征的对称加密协议识别模型,完成对所述网络流量数据的识别。以此方式,实现了对对称加密协议的高效识别。
-
公开(公告)号:CN112258377A
公开(公告)日:2021-01-22
申请号:CN202011088661.6
申请日:2020-10-13
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种鲁棒二值神经网络的构建方法及设备。鲁棒二值神经网络的构建方法,包括:对训练数据进行二值化处理;基于二值化处理后的训练数据,对预设二值神经网络进行训练;对完成训练的预设二值神经网络进行纠错编码。采用本发明,通过对训练数据进行二值化处理,可以将内存占用降低为原有的浮点型权值的1/32;同时,对训练好的二值神经网络进行纠错编码,使得编码后二元神经网络具有抵抗檫除或者错误的噪音干扰,所以编码后的二元神经网络具有很好的鲁棒性。
-
公开(公告)号:CN111159990A
公开(公告)日:2020-05-15
申请号:CN201911244936.8
申请日:2019-12-06
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/186 , G06F40/126 , G06F40/284 , G06F16/33 , G06F16/31
Abstract: 本发明提出一种基于模式拓展的通用特殊词识别方法及系统,提出了一种基于基础词的音形编码,常用汉字音节,常用汉字结构以及特殊字符映射节点来构建前缀树,通过比较字符编码相似度进行模糊匹配,完成新词提取的方法及系统。本发明可以应用于大量文本中特定词的发现提取,某些任务的数据集的提取生成,给定文本数据集的预处理等场景中,比如短信、微博等数据集的筛选以及纠正等文本预处理过程。本发明为下一步的文本分类任务提供了数据来源和基本标注,也对文本数据中新词的发现和纠正提供了帮助。
-
公开(公告)号:CN111078876A
公开(公告)日:2020-04-28
申请号:CN201911229492.0
申请日:2019-12-04
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/35
Abstract: 本发明提出了一种基于多模型集成的短文本分类方法,包括:选取多个对短文本进行分类的分类模型;对训练样本进行采样,生成与该分类模型一一对应的训练集;通过对应的训练集对该分类模型进行训练,以获得对应的最终模型;通过所有该最终模型对目标文本进行分类,获取多个分类结果向量;集成所有该分类结果向量以得到最终结果向量,以该最终结果向量中具有最大值的元素所代表的类别,作为该目标文本的类别。
-
公开(公告)号:CN118520929A
公开(公告)日:2024-08-20
申请号:CN202411003497.2
申请日:2024-07-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/09 , G06N3/0455 , G06F40/194
Abstract: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
公开(公告)号:CN114817516B
公开(公告)日:2024-08-09
申请号:CN202210448769.4
申请日:2022-04-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06F16/35 , G06F16/951 , G06F40/242 , G06F40/279 , G06F40/30 , G06N3/088
Abstract: 本发明涉及一种零样本条件下基于逆向匹配的画像映射方法,包括在数据特征标签和画像标签两个不同体系间建构双相关文本语料库,使用逆向匹配对语料库进行筛选修正;通过人工标注构建分类语料库,并训练模型建立画像体系间的映射关系;采用基于持续响应衰减的更新机制,并结合标签历史状态对时序变化的画像相关更新数据进行修正。本方法从扩展数据的角度出发,采用基于逆向匹配的文本库构建方法,引入与原始标签相关的外部文本数据扩展并增强标签的语义表达,再引入与用户画像相关的外部数据进行标注建立扩展标签和标注数据之间的联系,从而挖掘出原始特征标签隐含的丰富含义,达到从少量标签序列中计算目标画像的目的。
-
公开(公告)号:CN115034286B
公开(公告)日:2024-07-02
申请号:CN202210435266.3
申请日:2022-04-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06F18/214 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置,其中,该方法包括:获取web系统的用户行为日志数据样本,并将用户行为日志数据样本向量化,得到无标签数据样本和有标签数据样本;进行数据预处理得到训练数据集;基于训练数据集的输入特征训练第一自编码器模型,并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数;迭代优化第一自编码器模型并构造异常用户检测优化问题函数,得到第二自编码器模型;基于第二自编码器模型,对无标签数据样本进行异常点检测,以识别异常用户。本发明解决实际业务场景中,无标签数据中存在异常点,采用固定损失函数难以提高准确率,误报率高的技术问题。
-
公开(公告)号:CN118014049A
公开(公告)日:2024-05-10
申请号:CN202410177798.0
申请日:2024-02-08
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06N3/09 , G06N3/0455 , G06F18/22 , G06F18/2431 , G06F40/30 , G06V20/70 , G06V10/40 , G06V10/82
Abstract: 本发明提供一种图文互生模型的训练方法,该方法包括:基于模态自感单元从样本模态数据中提取自感信息;模态自感单元基于自注意力网络通过多任务有监督训练得到;基于图文编码器对自感信息进行编码,得到隐空间特征,并对隐空间特征进行多模态扩散处理,得到扩散后的目标模态类型的隐空间特征;基于图文解码器对自感信息和扩散后的目标模态类型的隐空间特征进行解码,得到解码信息;根据解码信息和多任务损失函数对图文编码器和图文解码器进行训练,得到图文互生模型;目标损失包括重建损失、图像类的理解辅助任务对应损失和文本类的理解辅助任务对应损失确定。本发明所述方法提高了图文互生对应模型的性能和可适配性。
-
-
-
-
-
-
-
-
-