-
公开(公告)号:CN113688887A
公开(公告)日:2021-11-23
申请号:CN202110931644.2
申请日:2021-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质,涉及图像处理、深度学习等人工智能技术领域。图像识别模型的训练方法包括:获取多张第一图像;根据所述多张第一图像中的标识图案,生成多张第二图像;根据所述多张第一图像与所述多张第二图像,构建图像集;使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。图像识别方法包括:获取待识别图像;将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案。本公开能够降低图像识别模型的训练成本,提升图像识别模型的识别准确性。
-
公开(公告)号:CN113076932A
公开(公告)日:2021-07-06
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
公开(公告)号:CN112650885A
公开(公告)日:2021-04-13
申请号:CN202110090987.0
申请日:2021-01-22
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种视频分类方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域。实现方案为:对目标视频进行抽帧,以得到多个目标视频帧,所述多个目标视频帧包括时间标签;以及将所述多个目标视频帧输入训练好的神经网络模型,获取所述神经网络模型输出的所述目标视频的预测类别,所述预测类别能够表征所述目标视频是否包括未成年人。
-
-