-
公开(公告)号:CN104992708B
公开(公告)日:2018-07-24
申请号:CN201510236568.8
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明涉及一种短时特定音频检测模型生成方法,包括:对训练语音数据进行特征提取;其中,所述训练语音数据包括非特定音频数据与特定音频数据;用训练语音数据的特征,进行通用背景模型的训练;由训练语音数据中某一类特定音频数据的特征,根据通用背景模型中自适应地得到该类特定音频数据的模型;重复这一操作,直至得到训练语音数据中所有类特定音频数据的模型。本发明还提供了一种短时特定音频检测方法,该方法通过模型打分进行特定音频的检测。这种方法不仅可以很好地解决特定音频模型训练数据不充足的问题,还可以一定程度的对输入数据的背景噪声进行抑制。
-
公开(公告)号:CN111354352B
公开(公告)日:2023-07-14
申请号:CN201811582260.9
申请日:2018-12-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种用于音频检索的模板自动清洗方法及系统,所述方法包括:提取模板的语音信号的特征,形成特征序列;将语音特征序列输入预先训练好的深度神经网络,输出每一帧语音特征的后验概率;将后验概率转换为似然概率,然后进行Viterbi解码,输出最终的模板清洗结果。本发明的方法充分利用了深度神经网络以及数据驱动方法的优点,通过加入多样的非语音数据,使得DNN能够学习到无效语音与输入特征的非线性映射关系;同时,利用Viterbi算法能够增加系统对短时噪声、短暂频谱残缺等问题的鲁棒性。
-
公开(公告)号:CN111354352A
公开(公告)日:2020-06-30
申请号:CN201811582260.9
申请日:2018-12-24
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种用于音频检索的模板自动清洗方法及系统,所述方法包括:提取模板的语音信号的特征,形成特征序列;将语音特征序列输入预先训练好的深度神经网络,输出每一帧语音特征的后验概率;将后验概率转换为似然概率,然后进行Viterbi解码,输出最终的模板清洗结果。本发明的方法充分利用了深度神经网络以及数据驱动方法的优点,通过加入多样的非语音数据,使得DNN能够学习到无效语音与输入特征的非线性映射关系;同时,利用Viterbi算法能够增加系统对短时噪声、短暂频谱残缺等问题的鲁棒性。
-
公开(公告)号:CN104992708A
公开(公告)日:2015-10-21
申请号:CN201510236568.8
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明涉及一种短时特定音频检测模型生成方法,包括:对训练语音数据进行特征提取;其中,所述训练语音数据包括非特定音频数据与特定音频数据;用训练语音数据的特征,进行通用背景模型的训练;由训练语音数据中某一类特定音频数据的特征,根据通用背景模型中自适应地得到该类特定音频数据的模型;重复这一操作,直至得到训练语音数据中所有类特定音频数据的模型。本发明还提供了一种短时特定音频检测方法,该方法通过模型打分进行特定音频的检测。这种方法不仅可以很好地解决特定音频模型训练数据不充足的问题,还可以一定程度的对输入数据的背景噪声进行抑制。
-
公开(公告)号:CN111382302B
公开(公告)日:2023-08-11
申请号:CN201811619717.9
申请日:2018-12-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/683 , G06F16/632 , G06F16/61
Abstract: 本发明涉及一种基于变速模板的音频样例检索方法,该方法具体包括:针对长度5秒以上的变速模板的待检音频拆分为多个短音频片段,获取各个短音频片段的二进制音频指纹序列值,查找预先建立的哈希表;查找出各个短音频片段的二进制音频指纹序列值对应的模板音频的音频指纹序列值;计算各个短音频片段和模板音频之间指纹序列差异数D和模板音频与短音频片段之间允许指纹序列差异数的阈值Reject;如果D<Reject,则认为短音频片段与模板音频相似;如果D>Reject,则认为短音频片段存在错误,并提取该短音频片段。
-
公开(公告)号:CN111382303B
公开(公告)日:2023-11-28
申请号:CN201811619718.3
申请日:2018-12-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/683 , G06F16/61
Abstract: 本发明涉及一种基于指纹权重的音频样例检索方法,该方法具体包括:获取待检音频的二进制音频指纹序列值,在预先建立的哈希表中进行查找;查找出对应的模板音频的二进制音频指纹序列值;计算待检音频和模板音频之间指纹序列差异数D、模板音频与待检音频之间允许指纹序列差异数的阈值Reject;如果D<Reject,则认为待检音频与模板音频相似;如果D>Reject,则认为待检音频存在错误。
-
公开(公告)号:CN111382303A
公开(公告)日:2020-07-07
申请号:CN201811619718.3
申请日:2018-12-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/683 , G06F16/61
Abstract: 本发明涉及一种基于指纹权重的音频样例检索方法,该方法具体包括:获取待检音频的二进制音频指纹序列值,在预先建立的哈希表中进行查找;查找出对应的模板音频的二进制音频指纹序列值;计算待检音频和模板音频之间指纹序列差异数D、模板音频与待检音频之间允许指纹序列差异数的阈值Reject;如果D<Reject,则认为待检音频与模板音频相似;如果D>Reject,则认为待检音频存在错误。
-
公开(公告)号:CN111382302A
公开(公告)日:2020-07-07
申请号:CN201811619717.9
申请日:2018-12-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/683 , G06F16/632 , G06F16/61
Abstract: 本发明涉及一种基于变速模板的音频样例检索方法,该方法具体包括:针对长度5秒以上的变速模板的待检音频拆分为多个短音频片段,获取各个短音频片段的二进制音频指纹序列值,查找预先建立的哈希表;查找出各个短音频片段的二进制音频指纹序列值对应的模板音频的音频指纹序列值;计算各个短音频片段和模板音频之间指纹序列差异数D和模板音频与短音频片段之间允许指纹序列差异数的阈值Reject;如果D<Reject,则认为短音频片段与模板音频相似;如果D>Reject,则认为短音频片段存在错误,并提取该短音频片段。
-
公开(公告)号:CN108650194B
公开(公告)日:2022-03-25
申请号:CN201810454425.8
申请日:2018-05-14
Applicant: 南开大学 , 国家计算机网络与信息安全管理中心
IPC: H04L47/2441 , H04L47/2483 , G06K9/62
Abstract: 本发明提出了基于K_means和KNN融合算法的网络流量分类方法。该方法的框架是针对每个应用协议构建一个二分类器,由决策规则将所有分类器的输出整合为最终输出。算法上融合了无监督的K_means算法和有监督的KNN算法,此外,该方法还提出了基于K_means迭代的特征选择算法,目的是选出高分离度的特征,以节省时间、空间和提高分类效果。实验结果表明,在真实流量数据上,本发明对流量识别的准确率和召回率可达90%以上,相比现有典型的流量分类方法效果更好;本发明还可识别出未登录流量,与典型的分类方法相比在功能上有了扩展。
-
公开(公告)号:CN114116172A
公开(公告)日:2022-03-01
申请号:CN202111454126.2
申请日:2021-12-01
Applicant: 恒安嘉新(北京)科技股份公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种流量数据采集方法、装置、设备及存储介质,包括:接收多个数据采集策略,根据各数据采集策略对应的通信层,将各数据采集策略分别传输至对应的层级处理模块;所述数据采集策略根据业务需求预先设定;通过各层级处理模块执行多个数据采集策略,并实时对DPI系统运行过程中占用的资源进行监控,得到资源占用结果;如果资源占用结果超过预设阈值,则通过各层级处理模块根据各数据采集策略对应的优先级,在多个数据采集策略中依次确定待执行的目标采集策略,并依次执行目标采集策略。本发明实施例的技术方案可以实现移动互联网中的流量数据按需采集,满足业务需求和资源占用之间的平衡。
-
-
-
-
-
-
-
-
-