-
公开(公告)号:CN117593679A
公开(公告)日:2024-02-23
申请号:CN202311340257.7
申请日:2023-10-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V40/16 , G06V10/764 , G06V10/25 , G06V10/82 , G06N3/084 , G06N3/0499
Abstract: 本发明提供一种伪造视频检测方法、装置、电子设备及存储介质,涉及计算机技术领域,方法包括:基于待检测视频,确定待检测视频对应的第一判别特征向量和第二判别特征向量;第一判别特征向量表示待检测视频中每帧人脸图像之间的时域特征信息;第二判别特征向量表示待检测视频中每帧人脸图像之间的频域特征信息;基于第一判别特征向量和第二判别特征向量,确定待检测视频对应的目标特征向量;目标特征向量表示融合时域特征信息和频域特征信息的特征信息;基于目标特征向量,确定待检测视频的检测结果。通过时域特征信息和频域特征信息的融合,能够准确确定待检测视频的检测结果,提升了待检测视频的检测精度。
-
公开(公告)号:CN116778910A
公开(公告)日:2023-09-19
申请号:CN202310505872.2
申请日:2023-05-06
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/28 , G06F18/2135 , G06F18/241 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种语音检测方法,包括:获取目标语音,将所述目标语音进行预处理,所述预处理包括预加重、分帧及加窗;确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征;基于所述第一声道特征、第一声源波特征和多种第一相关特征确定所述第一主成分特征;将所述第一主成分特征输入训练好的分类器,输出分类的结果,所述分类结果为伪造语音,或自然语音。本申请利用伪造语音在基频处留下的痕迹信息,利用伪造语音与自然语音在声源和声道特征上的差异以实现伪造语音检测。使用主成分分析的方法分别对声源和声道特征进行筛选,选取具有较高相关性的主成分作为特征,减少特征维度和冗余特征,提高模型的泛化能力和效率。
-
公开(公告)号:CN111625661B
公开(公告)日:2023-09-08
申请号:CN202010408234.5
申请日:2020-05-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/45 , G06F16/483 , H04N21/845 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/084
Abstract: 本发明实施例公开了一种音视频片段分类方法及装置,所述方法包括:基于待分类音视频片段的视频帧序列提取目标视频帧,基于待分类音视频片段的音频帧序列提取目标音频帧;基于目标视频帧/目标音频帧的第一出现时刻/第二出现时刻及预设子片段时长确定第一音视频子片段/第二音视频子片段;基于第一音视频子片段/第二音视频子片段提取第一视频分量特征和第一音频分量特征/第二视频分量特征和第二音频分量特征;通过预设音视频分类模型基于第一视频分量特征、第一音频分量特征、第二视频分量特征和第二音频分量特征确定待分类音视频片段的音视频分类结果。采用本发明可以提高音视频分类效率,提高音视频分类的鲁棒性和准确率。
-
公开(公告)号:CN116129913A
公开(公告)日:2023-05-16
申请号:CN202211490461.2
申请日:2022-11-25
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例公开了一种基于频带选择的伪造语音检测方法。所述方法包括,获取目标语音信号,将目标语音信号进行变换,获得语谱图特征;对所述语谱图特征进行频带切分,获得低频子带特征和高频子带特征;使用低频子带特征训练语音合成伪造语音检测模型;使用高频子带特征训练录音回放伪造语音检测模型;然后将低频子带特征输入语音合成伪造语音检测模型;以及将交叉匹配的高、低频子带特征输入录音回放伪造语音检测模型,获得最终的语音检测结果。在本发明实施例中,实现了提升神经网络伪造语音检测系统在数据集不匹配等情况下的鲁棒性,以及通过子带选择减小了特征大小,降低了伪造语音检测的参数量和计算量。
-
公开(公告)号:CN115759043A
公开(公告)日:2023-03-07
申请号:CN202211434726.7
申请日:2022-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/30 , G06N3/0464 , G06N3/08 , G06F18/241
Abstract: 本发明涉及一种文档级敏感信息检测模型训练及预测方法,所述训练方法包括:获取训练样本集;使用上下文编码器对所述文档中的每个句子进行编码,得到句子中每个单词的上下文表示,根据所述句子中最短依赖路径上的关系和所述上下文语义的关联强度,生成文档级实体注意力权重图;将所述注意力权重图输入到图卷积神经网络中,得到文档级跨句语义结构,根据所述文档级跨句语义结构,更新所述注意力权重图;将更新后的注意力权重图输入到分类器中,得到分类分数;根据所述分类分数与所述标签计算损失值,根据所述损失值对所述上下文编码器、图卷积神经网络和分类器进行训练,得到训练完成的模型。
-
公开(公告)号:CN115700514A
公开(公告)日:2023-02-07
申请号:CN202110806905.8
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/332 , G06F40/30 , G06F18/2411
Abstract: 本发明公开了一种结合BIGRU和多头注意的事件主体提取方法及装置,包括:把文本数据转化为文本输入序列X;利用BiGRU网络获取文本输入序列X对应的向量XB;基于文本输入序列X与向量XB进行多头注意力计算;依据注意力计算结果,获取事件主体提取结果。本发明使用BIGRU网络学习上下文语义特征,通过引入多头注意力机制捕获序列中的关键特征信息,提高了工作效率及准确性。
-
公开(公告)号:CN115221940A
公开(公告)日:2022-10-21
申请号:CN202210617794.0
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于决策树的历史通讯记录异常行为分析方法及系统,所述一种基于决策树的历史通讯记录异常行为分析方法包括采集历史通讯记录数据进行预处理得到历史通讯记录预处理数据;利用所述历史通讯记录预处理数据得到历史通讯记录异常行为分析结果,结合通话行为和标记库与互联网标记等信息,实现异常电话的精准发现,避免错误捕捉正常用户号码,进而对正常用户实现保护。
-
公开(公告)号:CN113436616B
公开(公告)日:2022-08-02
申请号:CN202110594183.4
申请日:2021-05-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本申请提出一种多领域自适应的端到端语音识别方法,所述方法包括:提取待识别语音的第一特征;将所述第一特征和领域标签输入训练好的端到端语音识别模型;所述领域标签是为所述待识别语音的预先设定的口音标签;基于所述训练好的端到端语音识别模型,根据所述领域标签提取第二特征,将所述第一特征与所述第二特征拼接后进行编码得到第三特征;对所述第三特征进行解码,得到多条候选文本,输出第一文本候选列表,所述第一文本候选列表包括所述多条候选文本。本申请通过使用多领域自适应的方法,利用丰富资源领域预训练模型、多目标领域数据及多目标领域鉴别特征来提升在多个目标领域上的语音识别性能。
-
公开(公告)号:CN111541645B
公开(公告)日:2022-06-17
申请号:CN202010213474.X
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: H04L61/4511 , H04L65/1101 , H04M7/00 , G06F16/2455 , G06F16/2458 , G06F16/248 , G06N5/02
Abstract: 本发明公开了一种VoIP服务知识库构建方法及系统。本方法为:1)在各选定的物理网关上分别部署一实时流量解析模块,用于从VoIP流量中解析出SIP协议和SDP协议,生成VoIP信令日志发送至消息队列;2)从各消息队列中实时读取VoIP信令日志并对其统一标准化;3)对标准化日志进行实时统计计算,并将统计计算结果实时存入实时结果数据库;4)定期从原始日志数据库中获取标准化日志进行聚合,得到各服务域名下的统计信息;然后基于服务域名下的统计信息和设定的判断条件判断该服务域名所代表的VoIP服务的网关类型、VoIP服务与PSTN的关系以及VoIP服务是否存在可疑行为,并将其保存在VoIP服务基础知识库。
-
公开(公告)号:CN113436616A
公开(公告)日:2021-09-24
申请号:CN202110594183.4
申请日:2021-05-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本申请提出一种多领域自适应的端到端语音识别方法,所述方法包括:提取待识别语音的第一特征;将所述第一特征和领域标签输入训练好的端到端语音识别模型;所述领域标签是为所述待识别语音的预先设定的口音标签;基于所述训练好的端到端语音识别模型,根据所述领域标签提取第二特征,将所述第一特征与所述第二特征拼接后进行编码得到第三特征;对所述第三特征进行解码,得到多条候选文本,输出第一文本候选列表,所述第一文本候选列表包括所述多条候选文本。本申请通过使用多领域自适应的方法,利用丰富资源领域预训练模型、多目标领域数据及多目标领域鉴别特征来提升在多个目标领域上的语音识别性能。
-
-
-
-
-
-
-
-
-