-
公开(公告)号:CN110047509A
公开(公告)日:2019-07-23
申请号:CN201910240865.8
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种两级子空间划分方法及装置,用于实现:采用基于模型子空间的二级匹配方法,处理过程分为两个步骤:第一步通过粗筛定位子空间,确定待检音频模型空间所属范围,第二步细匹,即在子空间内部通过精度较高的传统算法命中目标模型,即包括特征提取、聚类计算、子空间划分、中心点计算四个过程。本发明的有益效果为:实现简单,耗时较小,对于数量巨大的模型特征,其实时性足以满足业务需求,可任意调整簇数的取值,能够有效的划分子空间,并且能够较为均匀的划分到不同的子空间中,同时缩小了模型匹配范围,单次语音特征比较能够有效降低模型数量,提高了效率。
-
公开(公告)号:CN112331181B
公开(公告)日:2024-07-05
申请号:CN201910694870.6
申请日:2019-07-30
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于目标语音提取和自适应技术领域,具体涉及一种基于多说话人条件下目标说话人语音提取方法,该方法具体包括:实时获取多个说话人混合的语音,提取多个说话人混合的语音的频谱;将锚语音输入到预先训练的说话人识别模型中,提取出目标说话人的特征向量;将获取的多个说话人混合的语音的频谱和目标说话人的特征向量输入至预先训练的目标说话人语音提取网络中,获取目标说话人的语音频谱;基于该目标说话人的语音频谱,获取目标说话人的语音。
-
公开(公告)号:CN113326689B
公开(公告)日:2023-08-18
申请号:CN202010128327.2
申请日:2020-02-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/205 , G06F40/211 , G06F18/214 , G06F18/2415 , G06N3/045 , G06N3/092
Abstract: 本发明属于数据通信和数据处理技术领域,具体涉及一种基于深度强化学习模型的数据清洗方法,该方法包括:获取待清洗的带标签的数据集;采用预筛选算法,删除待清洗的带标签的数据集中的无内容数据、不在标签集内的标签数据和标签矛盾的数据,获得待分类的数据集;将待分类的数据集输入至预先训练的深度强化学习模型中,获得不同类别的延迟奖励;再根据获得的不同类别的延迟奖励,依据预先训练的深度强化学习模型中的动作集合,丢弃掉有偏数据,保留有效数据,并更新状态列表S,最大化每一类别的延迟奖励值,将每一类别的最大延迟奖励值对应的带标签的训练数据集作为清洗干净的带标签的训练数据集,从而完成数据清洗。
-
公开(公告)号:CN111354347B
公开(公告)日:2023-08-15
申请号:CN201811571564.5
申请日:2018-12-21
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/08
Abstract: 本发明提出了一种基于自适应热词权重的语音识别方法及系统,所述方法包括:生成热词网络并和静态解码网络一起加载到语音识别解码器中;将待识别的语音信号同步地在静态解码网络和热词网络上进行令牌传递,自适应地计算热词权重,并对静态解码网络上令牌的分数重新打分;输出解码结果。本发明的基于自适应热词权重的语音识别方法在一遍解码的过程中就能提升热词召回率,不影响解码的速度,并且自适应地计算热词权重既能有效地提高热词的召回率,不影响原先的解码速度,又能提高系统的鲁棒性。
-
公开(公告)号:CN110047509B
公开(公告)日:2021-04-02
申请号:CN201910240865.8
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种两级子空间划分方法及装置,用于实现:采用基于模型子空间的二级匹配方法,处理过程分为两个步骤:第一步通过粗筛定位子空间,确定待检音频模型空间所属范围,第二步细匹,即在子空间内部通过精度较高的传统算法命中目标模型,即包括特征提取、聚类计算、子空间划分、中心点计算四个过程。本发明的有益效果为:实现简单,耗时较小,对于数量巨大的模型特征,其实时性足以满足业务需求,可任意调整簇数的取值,能够有效的划分子空间,并且能够较为均匀的划分到不同的子空间中,同时缩小了模型匹配范围,单次语音特征比较能够有效降低模型数量,提高了效率。
-
公开(公告)号:CN111863007A
公开(公告)日:2020-10-30
申请号:CN202010554629.6
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G10L21/0208 , G10L21/0272 , G06N3/04
Abstract: 本发明公开了一种基于深度学习的语音增强方法及系统,该方法包括如下步骤:步骤SS1:获得带噪语音的多个IRM预测值的解的集合;步骤SS2:将来自所述Boosting-DNN语音增强模型输出的IRM的解的集合拼接带噪特征作为输入,预测最终的IRM预测值集合 本发明通过将Boosting-DNN语音增强模型和Ensemble-DNN集成语音增强模型这两个DNN串接起来的方式,有效的解决了一个神经网络由于层次太深训练不稳定的现象,构建一种非常深的网络结构,彻底解决前端语音增强技术就可以确保把语音从带噪信号中分离出来,以便后端识别模型能正确识别语音的内容。
-
公开(公告)号:CN110602332A
公开(公告)日:2019-12-20
申请号:CN201910708779.5
申请日:2019-08-01
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述通信线路特征提取方法包括:获取主叫端与被叫端之间的通话音频;对所述通话音频进行处理,以去除所述通话音频中的人声音频;分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征,从而能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。
-
公开(公告)号:CN110719592B
公开(公告)日:2023-01-31
申请号:CN201910992033.1
申请日:2019-10-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W12/128
Abstract: 一种兼容4G和5G网络的防范诈骗电话的系统与方法,包括:业务管理装置,将通话检测策略数据下发给汇聚装置,并接收汇聚装置上传的呼叫数据;汇聚装置,根据通话检测策略数据,从样本数据中提取特征信息,并加密,再将加密后的通话检测策略数据和特征信息发给各个前端接入装置;同时,将各个前端接入装置发来的呼叫数据还原后回传给业务管理装置;前端接入装置,根据收到的通话检测策略数据,对触发至核心网元的呼叫进行信令的实时解析,并将符合通话检测策略的呼叫数据回传给汇聚装置。本发明属于信息技术领域,能构建一套兼容4G并适配5G分组化、扁平化网络下的诈骗电话防范网络,保障不断演进的电信网络架构下的通信安全。
-
公开(公告)号:CN113077785B
公开(公告)日:2022-07-12
申请号:CN201911300918.7
申请日:2019-12-17
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于网络通信技术领域,具体涉及一种端到端的多语言连续语音流语音内容识别方法,该方法包括:将待识别的语音频谱特征输入至预先构建的基于深度神经网络的段级别语种分类模型,提取语句级别语种状态后验概率分布向量;将每一种语言种类的待识别的语音频谱特征序列和语句级别语种状态后验概率分布向量输入至预先构建的多语言语音识别模型,输出对应语言种类的语音识别结果。
-
公开(公告)号:CN109587350B
公开(公告)日:2021-06-22
申请号:CN201811373658.1
申请日:2018-11-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/2458 , H04W12/12 , H04M3/22
Abstract: 本发明公开了一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法,属于数据挖掘与机器学习和商务智能领域。首先构造训练用户数据集,回溯被叫用户全部通话记录,形成各被叫用户通话序列。利用cos相似度函数,计算序列结构相似度和统计特征相似度并进行线性组合,得到加和相似度。然后通过K‑Means聚类模型得到K类用户,构成独立的序列训练数据集,通过滑动时间窗口,形成K个训练集。最后在每个训练集上训练iForest模型,得到K个异常检测模型。每个被叫用户通过对应的异常检测模型识别异常,当最大值高于阈值h时,该被叫用户是高风险的被叫用户。每过固定时间段更新K‑Means模型和异常检测模型。本发明缓解了数据稀疏性问题,发现基于群组的异常特征。
-
-
-
-
-
-
-
-
-