-
公开(公告)号:CN113705370B
公开(公告)日:2023-06-30
申请号:CN202110909967.1
申请日:2021-08-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V20/40 , G06V10/74 , G06V10/774 , G06V10/80 , G06N20/00
Abstract: 本公开公开了直播间违规行为的检测方法、装置、电子设备和存储介质,涉及互联网移动端应用技术领域。在对待检测视频进行抽帧,得到若干个视频帧后,再将若干个视频帧依次输入违规行为检测模型,以确定视频帧中是否存在违规行为,并对违规行为进行异常标记,若根据第一视频帧的异常标记确定第一视频帧存在第一违规行为,根据第二视频帧的异常标记确认第二视频帧是否存在第二违规行为,其中,第二视频帧为若干视频帧中第一视频帧的上一视频帧,最后在确定第二视频帧存在第二违规行为后,根据第一违规行为及第二违规行为确定待检测视频存在直播间违规行为,该检测方法通过多帧融合机制,确保了直播间违规行为检测的准确率。
-
公开(公告)号:CN114241374B
公开(公告)日:2022-12-13
申请号:CN202111530235.8
申请日:2021-12-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V20/40 , G06V10/25 , G06V10/774 , G06V10/82 , G06N3/04
Abstract: 本公开提供了直播处理模型的训练方法和装置、直播处理方法和装置,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:从直播图像中提取候选样本图像;采用直播处理模型,对所述候选样本图像进行处理得到候选样本图像的处理结果;所述直播处理模型包括直播检测模型和直播分类模型,所述候选样本图像的处理结果包括候选样本图像的检测结果和分类结果;根据所述候选样本图像的处理结果,从所述候选样本图像中确定目标样本图像,并采用所述目标样本图像对所述直播处理模型进行训练。本公开可以提高对直播处理模型的训练效率和识别准确度。
-
公开(公告)号:CN109947988B
公开(公告)日:2022-12-13
申请号:CN201910175790.X
申请日:2019-03-08
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/738 , G06F16/78 , G06F16/783
Abstract: 本发明提供一种信息处理方法、装置、终端设备及服务器。该方法应用于终端设备,包括:在通过显示界面播放视频时,将当前视频帧或者当前视频帧的帧标识发送至服务器;接收服务器返回的返回信息;其中,返回信息中包括当前视频帧的对象关联信息和对象位置信息;根据对象关联信息和对象位置信息,在显示界面进行显示处理。可见,与现有技术相比,本发明实施例中,用户能够更为便捷地认识视频中出现的对象。
-
公开(公告)号:CN113076932B
公开(公告)日:2023-08-04
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
公开(公告)号:CN114241374A
公开(公告)日:2022-03-25
申请号:CN202111530235.8
申请日:2021-12-14
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了直播处理模型的训练方法和装置、直播处理方法和装置,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:从直播图像中提取候选样本图像;采用直播处理模型,对所述候选样本图像进行处理得到候选样本图像的处理结果;所述直播处理模型包括直播检测模型和直播分类模型,所述候选样本图像的处理结果包括候选样本图像的检测结果和分类结果;根据所述候选样本图像的处理结果,从所述候选样本图像中确定目标样本图像,并采用所述目标样本图像对所述直播处理模型进行训练。本公开可以提高对直播处理模型的训练效率和识别准确度。
-
公开(公告)号:CN114241243A
公开(公告)日:2022-03-25
申请号:CN202111565672.3
申请日:2021-12-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本公开提供了一种图像分类模型的训练方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习领域和图像处理领域,可应用于异常图像的检测场景等。图像分类模型的训练方法包括:采用已标注数据集对图像分类模型进行训练,得到初始模型;迭代地执行以下更新操作,直至更新后的初始模型达到收敛条件:采用初始模型从未标注数据中获得备选扩充数据;以及根据备选扩充数据更新已标注数据集和初始模型;其中,图像分类模型的训练方法还包括在在迭代地执行更新操作的过程中:确定针对标注类别的预测概率低于第一预定概率的目标数据;以及周期性地采用目标数据更新已标注数据集。
-
公开(公告)号:CN113688887A
公开(公告)日:2021-11-23
申请号:CN202110931644.2
申请日:2021-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质,涉及图像处理、深度学习等人工智能技术领域。图像识别模型的训练方法包括:获取多张第一图像;根据所述多张第一图像中的标识图案,生成多张第二图像;根据所述多张第一图像与所述多张第二图像,构建图像集;使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。图像识别方法包括:获取待识别图像;将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案。本公开能够降低图像识别模型的训练成本,提升图像识别模型的识别准确性。
-
公开(公告)号:CN113076932A
公开(公告)日:2021-07-06
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
公开(公告)号:CN112650885A
公开(公告)日:2021-04-13
申请号:CN202110090987.0
申请日:2021-01-22
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种视频分类方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域。实现方案为:对目标视频进行抽帧,以得到多个目标视频帧,所述多个目标视频帧包括时间标签;以及将所述多个目标视频帧输入训练好的神经网络模型,获取所述神经网络模型输出的所述目标视频的预测类别,所述预测类别能够表征所述目标视频是否包括未成年人。
-
公开(公告)号:CN112819761B
公开(公告)日:2023-09-01
申请号:CN202110083067.6
申请日:2021-01-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T7/00 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种模型训练方法、分数确定方法、装置、设备、介质和产品,可以用于视频分类领域、人物识别领域和视频推荐领域中。该方法包括:使用清晰度确定模型,确定预定图像集合中的至少一个预定图像的清晰度分数;使用清晰度确定模型,针对至少一个预定图像确定显著性;以及调整清晰度确定模型的参数,使得所确定的清晰度分数和所确定的显著性和与至少一个预定图像对应的预定清晰度分数和预定显著性的差别尽可能小。利用上述方法,能够基于输入图像中、人们关注的部分来对输入图像的清晰度打分,从而有助于进一步调整或者替换该输入图像,因此能够提高确定图像清晰度分数的准确度以及提升用户体验。
-
-
-
-
-
-
-
-
-