-
公开(公告)号:CN112836042A
公开(公告)日:2021-05-25
申请号:CN202011092228.X
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种有害音频识别方法、装置、电子设备及计算机可读介质。该有害音频识别方法,包括:获取待识别音频数据进行特征提取,并输入到关键词匹配模型,输出音频数据的开始时间和结束时间以及识别的文本内容;对所述识别的文本内容通过向量机算法SVM进行分类,生成文本集合结果。本发明通过获取待识别音频数据进行特征提取,并输入到关键词匹配模型,输出音频数据的开始时间和结束时间以及识别的文本内容;对所述识别的文本内容通过向量机算法SVM进行分类,生成文本集合结果,不断更新有害音频的正例样本库,提高有害音频检测的准确率。
-
公开(公告)号:CN112435672A
公开(公告)日:2021-03-02
申请号:CN202011105330.9
申请日:2020-10-15
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种声纹识别方法、装置、设备及存储介质,该方法包括:获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份;响应于所述用户身份识别成功,执行所述登录执行。本发明针对如何解决由于传统声纹识别算法的局限性,通过获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份,提高音频数据进行登录验证的准确率。
-
公开(公告)号:CN112466310A
公开(公告)日:2021-03-09
申请号:CN202011105315.4
申请日:2020-10-15
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了深度学习声纹识别方法、装置、电子设备及存储介质,该方法包括:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。本发明解决了传统声纹识别算法或者单纯数字密码验证的局限性,实现了较理想的密码验证准确率。
-
公开(公告)号:CN112836043A
公开(公告)日:2021-05-25
申请号:CN202011093000.2
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于预训练语言模型的长文本聚类方法及装置,该方法包括:步骤SS1:使用文本摘要模型将长文本压缩为短文本;步骤SS2:根据步骤SS1获得的所述短文本与BERT模型的有标签文本句子对来预测是否两个文本包含相同的事件,生成文本对初始分数;步骤SS3:使用步骤SS2获得的所述文本对初始分数作为初始分数,根据文本对相较于其他文本的关系来重新计算分数;步骤SS4:根据步骤SS3获得的文本对分数,从得分最高的文本对开始计算分组。本发明运用深度学习方法的同时,采用迁移学习,将大规模预训练模型应用到文本聚类中。
-
公开(公告)号:CN112466281A
公开(公告)日:2021-03-09
申请号:CN202011092988.0
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了有害音频识别解码方法及装置,该方法包括:获取待识别音频数据,提取待测音频中的声学特征,对所述声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果。本发明通过对声学特征进行有效音频检测得到有效音频段;将所述有效音频段输入到有害音频分类网络模型,从文本意图的角度对待测样本进行分类,输出文本集合分类结果;将所述文本集合分类结果输入声学模型中输出解码结果,通过构建元学习的目标函数,获取大数据量的意图分类网络参数更新过程,提高有害音频识别解码的准确率。
-
公开(公告)号:CN112837677A
公开(公告)日:2021-05-25
申请号:CN202011092241.5
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种有害音频检测方法及装置,该包括如下步骤:步骤SS1:输入语音数据进行连续语音关键词匹配,输出识别的文本内容,从关键词的角度检测待测音频中是否含有有害关键词;步骤SS2:基于步骤SS1获得的识别的文本内容,采用SVM分类器进行分类;步骤SS3:基于元学习进行有害音频分类网络,从文本意图的角度对待测样本进行分类;步骤SS4:对关键词匹配得分、SVM分类器得分、元学习分类网络得分进行融合,获得待测音频最终被检测为有害音频的得分S。本发明通过解决正、反例样本数量失衡条件下的小样本训练的问题,最终提高有害音频检测的准确率。
-
公开(公告)号:CN117496394A
公开(公告)日:2024-02-02
申请号:CN202311337406.4
申请日:2023-10-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V40/16 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/084 , G06N3/0464 , G10L25/57 , G10L25/30
Abstract: 本发明提供一种基于图像和语音多模态融合的伪造视频检测方法及装置,该方法涉及视频检测技术领域,包括:将待检测视频进行预处理,得到多个视频片段;待检测视频包括音频,每个视频片段包括音频;针对每个视频片段,分别提取视频片段的视频特征向量和视频片段中的音频的音频特征向量;基于各视频特征向量和各音频特征向量,确定待检测视频对应的总视频特征向量和总音频特征向量;基于各视频特征向量、各音频特征向量、总视频特征向量和总音频特征向量,确定待检测视频的目标检测结果;目标检测结果表示待检测视频为伪造视频或者真实视频,提升了待检测视频的目标检测结果的准确性,进而提升了对待检测视频中深度伪造内容的检测精度。
-
公开(公告)号:CN117035058A
公开(公告)日:2023-11-10
申请号:CN202310971765.9
申请日:2023-08-03
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明属于联邦学习领域,提供了一种基于联邦学习模型的训练方法,包括以下步骤:S11,定义问题:确定需要解决的机器学习问题、本地数据的来源、以及参与联邦学习的设备或节点;S12,模型选择和初始化:选择相应的模型,并在所有的本地设备或节点上初始化相应的模型,并下发至所有用户端;S13,本地训练:每个本地设备或节点使用其本地数据集对初始化的模型进行训练,得到一个本地模型;S14,模型聚合:在中央服务器上聚合本地模型;本发明通过在每个本地设备或节点都可以进行本地模型的训练和更新,进一步分散计算负载,提高训练速度和效率;通过设定停止条件来控制模型更新的频率,进而避免过度拟合等问题。
-
公开(公告)号:CN114915650B
公开(公告)日:2023-08-08
申请号:CN202210430295.0
申请日:2022-04-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L67/14 , H04L65/1104 , H04L65/65
Abstract: 本发明公开一种基于网元信息聚合的VoIP服务观测视角的判定方法及系统,涉及互联网语音传输服务领域,通过在单一观测点下对被动流量中VoIP网元信息进行聚合分析,进而判断其服务观测位置,可在全局观测点下提供各VoIP服务网元的相关信息,并为全局VoIP会话链路还原提供有效参考。
-
公开(公告)号:CN114936723B
公开(公告)日:2023-04-14
申请号:CN202210856300.4
申请日:2022-07-21
Applicant: 中国电子科技集团公司第三十研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及数据挖掘技术领域,公开了一种基于数据增强的社交网络用户属性预测方法及系统,该属性预测方法,基于用户的历史行为序列,推断用户未来一段时间的行为序列,通过将历史行为序列与预测得到的行为序列进行拼接,扩大行为序列的长度,对用户的行为数据进行增强。本发明解决了现有技术存在的在线网络用户行为序列长度较短时不能为用户属性预测任务提供足够信息、从而导致用户属性预测的预测准确性低的问题。
-
-
-
-
-
-
-
-
-