-
公开(公告)号:CN117939189B
公开(公告)日:2024-06-11
申请号:CN202410324004.9
申请日:2024-03-21
Applicant: 中国信息通信研究院
IPC: H04N21/231 , H04N21/24 , H04N21/266
Abstract: 本发明提出一种面向不良视频加密流量数据的质量属性评价方法和系统。其中,方法包括:采集预定义视频平台的不良视频明文数据并进行存储;识别和检测所述不良视频明文数据,并对不良视频明文数据进行分类、标记和存储;采集预定义种类的不良视频加密流量数据包信息,对不良视频明文数据和不良视频加密流量数据包信息进行映射和标记;对不良视频明文数据的基本属性进行评价的同时,对映射和标记后的不良视频加密流量数据包信息的采集环境属性进行评价,最后给出不良视频加密流量数据质量的综合评价。本发明提出的方案,便于数据集的管理与调用,也有利于检测识别模型的训练数据与评测数据的评估与筛选。
-
公开(公告)号:CN116781546A
公开(公告)日:2023-09-19
申请号:CN202310761030.3
申请日:2023-06-26
Applicant: 中国信息通信研究院
IPC: H04L43/04 , H04L41/16 , H04L9/40 , G06F18/24 , G06F18/214
Abstract: 本发明提供一种基于深度合成数据的异常检测方法和系统,通过检测点采样和构建网络拓扑建模预测流量途径的重要节点采样两种采样方式,得到两个不同的样本集,将两个样本集输入对抗性网络,计算两者之间的差异度,根据差异度调整流量途径的节点的预测,当该差异度小于等于阈值时表示捕获成功,融合得到深度合成样本集,最后通过识别模型分类。
-
公开(公告)号:CN116319467A
公开(公告)日:2023-06-23
申请号:CN202310573012.2
申请日:2023-05-22
Applicant: 中国信息通信研究院
IPC: H04L43/0876 , H04L43/026 , H04L9/40 , G10L17/02 , G10L17/14
Abstract: 本发明公开了一种基于IDC机房双向流量的深度合成音频检测方法及系统,该方法包括:按照预设采集策略获取现网IDC机房出口的原始流量数据,并对获取到的原始流量数据进行还原处理得到还原音频文件,其中原始流量数据包括加密流量数据和非加密流量数据;基于预先建立的样本特征库对还原音频文件进行数据去重处理;对经去重处理后的还原音频文件进行音频检测以得到检测结果;该方法可做到现网流量深度合成信息的实时检测,并为了提高文件检测效率,减轻检测端压力,对数据进行去重处理,整体检测流程数据流转思路明确,可扩展至对于其他类型文件的检测,检测方法的普适性较强。
-
公开(公告)号:CN114841983B
公开(公告)日:2022-12-06
申请号:CN202210556274.3
申请日:2022-05-17
Applicant: 中国信息通信研究院
IPC: G06T7/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于决策分数的图像对抗样本检测方法和系统。其中,方法包括:获取图像数据集并进行预处理,使用不同的模型结构对不同的数据集进行训练,选取各模型中的特定层以计算神经元的决策分数,针对不同的数据集,分别搭建不同的二元分类器,再应用各模型中的特定层计算出的决策分数,训练不同数据集对应的二元分类器,将对抗样本和良性样本的决策分数输入到训练好的二元分类器中进行测试,若分类精度不足,对二元分类器进行优化。本发明提出的方案,从模型内部神经元出发,通过少量样本计算模型的决策分数,训练简单的二元分类器,利用良性样本和对抗样本的决策分数差异,实现对抗样本的高精度、低成本检测。
-
公开(公告)号:CN114841983A
公开(公告)日:2022-08-02
申请号:CN202210556274.3
申请日:2022-05-17
Applicant: 中国信息通信研究院
IPC: G06T7/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于决策分数的图像对抗样本检测方法和系统。其中,方法包括:获取图像数据集并进行预处理,使用不同的模型结构对不同的数据集进行训练,选取各模型中的特定层以计算神经元的决策分数,针对不同的数据集,分别搭建不同的二元分类器,再应用各模型中的特定层计算出的决策分数,训练不同数据集对应的二元分类器,将对抗样本和良性样本的决策分数输入到训练好的二元分类器中进行测试,若分类精度不足,对二元分类器进行优化。本发明提出的方案,从模型内部神经元出发,通过少量样本计算模型的决策分数,训练简单的二元分类器,利用良性样本和对抗样本的决策分数差异,实现对抗样本的高精度、低成本检测。
-
公开(公告)号:CN112084308A
公开(公告)日:2020-12-15
申请号:CN202010974941.0
申请日:2020-09-16
Applicant: 中国信息通信研究院
IPC: G06F16/33 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30 , G06K9/62 , G06N7/00
Abstract: 本发明涉及用于文本类型数据识别的方法、系统及存储介质。在该方法中首先获取数据表中的各个字段,将所有字段信息进行连接得到字段集合,然后构建训练集,对训练集中的字段集合进行基于字节的1‑gram特征的提取,将提取的特征输入bayes分类器进行训练,最后对待识别的数据表进行特征的提取,将提取的特征输入分类器中进行识别,分类器输出分类识别结果。该方法使用单汉字或者单词为语义单位作为分类特征,避免了特征在训练样本中的稀疏性问题,将类别所有字段内容连接为一个大文件进行处理,且将贝叶斯概率计算用于该分类问题,将字段的先验概率、1‑gram的类别条件概率作为计算概率的主要变量,分类中使用对数运算实现得分的相加,提高了识别准确率。
-
公开(公告)号:CN116866211B
公开(公告)日:2024-02-23
申请号:CN202310763614.4
申请日:2023-06-26
Applicant: 中国信息通信研究院
IPC: H04L43/04 , H04L41/16 , H04L9/40 , G06F18/213 , G06F18/241 , G06N3/0464
Abstract: 本发明提供一种改进的深度合成检测方法和系统,通过针对不同类型的数据包,分别提取深度学习、生物和时间三个不同维度的特征,从而可以覆盖网络全类型的数据包。针对深度学习特征采用降维采样和滑动窗二次采样;针对生物特征采用生物指纹匹配和滑动框二次采样;针对时间特征根据差异化结果重新定义采样窗,再次对深度学习和生物两种特征进行采样重组。再利用帧内和帧间特征的差异性,计算两两特征之间的欧氏距离,以此判断对比损失,实现检测的高效和自动调整。
-
公开(公告)号:CN116781546B
公开(公告)日:2024-02-13
申请号:CN202310761030.3
申请日:2023-06-26
Applicant: 中国信息通信研究院
IPC: H04L43/04 , H04L41/16 , H04L9/40 , G06F18/24 , G06F18/214
Abstract: 本发明提供一种基于深度合成数据的异常检测方法和系统,通过检测点采样和构建网络拓扑建模预测流量途径的重要节点采样两种采样方式,得到两个不同的样本集,将两个样本集输入对抗性网络,计算两者之间的差异度,根据差异度调整流量途径的节点的预测,当该差异度小于等于阈值时表示捕获成功,融合得到深度合成样本集,最后通过识别模型分类。
-
公开(公告)号:CN116994590A
公开(公告)日:2023-11-03
申请号:CN202311253131.6
申请日:2023-09-27
Applicant: 中国信息通信研究院
Abstract: 本发明提出一种深度伪造音频鉴别方法和系统。其中,方法包括:基于随机质量压缩、模糊和随机添加附加噪声方法,对音频数据进行数据增强处理;将数据增强处理后的音频数据输入基于自监督学习的特征提取模型,得到音频特征;将所述音频特征输入基于残差结构的伪造鉴别模型,提取出音频的时序特征,以实现对音频的鉴别。本发明提出的方案能够利用自监督语音表示学习技术学习语音特征,降低对深度伪造音频数据的依赖,提高系统的泛化性;基于残差结构实现音频特征增强,充分提取音频的时序特征;使用数据增强方法提升训练数据的复杂性,提高鉴别模型的性能。
-
公开(公告)号:CN116881830A
公开(公告)日:2023-10-13
申请号:CN202310922859.7
申请日:2023-07-26
Applicant: 中国信息通信研究院
IPC: G06F18/2433 , G06F18/214 , G06F18/21 , G06F18/25 , G06N3/0464 , G06N3/088 , G06N3/0895
Abstract: 本发明提供一种基于人工智能的自适应检测方法和系统,通过构建包括主干网络、颈部网络和检测头网络架构的模型,能够区分得到用于检测大物体的深层特征和用于检测小物体的浅层特征,自适应识别不同类型的目标,以及通过使用无监督学习或半监督学习算法进行模型训练,可以使模型自适应地适应数据的特征,提高了检测的准确性和效率。此外,该方法和系统可以根据新的数据特征进行自适应地更新和调整,具有更强的灵活性和适应性。
-
-
-
-
-
-
-
-
-