-
公开(公告)号:CN113076932A
公开(公告)日:2021-07-06
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
公开(公告)号:CN110798736B
公开(公告)日:2021-04-20
申请号:CN201911195372.3
申请日:2019-11-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/44 , H04N21/462
Abstract: 本申请公开了一种视频播放方法、装置、设备和介质,涉及人工智能技术领域。具体实现方案为:在当前视频播放过程中,确定与当前视频有内容重合的候选视频;确定所述当前视频与所述候选视频之间的内容重合时间段;根据所述内容重合时间段,从所述候选视频中选择与所述当前视频具有时间连续性的目标视频;在所述当前视频播放结束时,继续播放所述目标视频。本申请实施例通过确定与当前视频内容相关且具有时间连续性的目标视频,在当前视频播放结束后继续播放目标视频,从而实现了相关视频的连续性播放,解决了当前视频播放结束后出现播放间断的问题,满足了用户继续观看后续相关视频的需求。
-
公开(公告)号:CN112650885A
公开(公告)日:2021-04-13
申请号:CN202110090987.0
申请日:2021-01-22
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种视频分类方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域。实现方案为:对目标视频进行抽帧,以得到多个目标视频帧,所述多个目标视频帧包括时间标签;以及将所述多个目标视频帧输入训练好的神经网络模型,获取所述神经网络模型输出的所述目标视频的预测类别,所述预测类别能够表征所述目标视频是否包括未成年人。
-
公开(公告)号:CN110798736A
公开(公告)日:2020-02-14
申请号:CN201911195372.3
申请日:2019-11-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/44 , H04N21/462
Abstract: 本申请公开了一种视频播放方法、装置、设备和介质,涉及人工智能技术领域。具体实现方案为:在当前视频播放过程中,确定与当前视频有内容重合的候选视频;确定所述当前视频与所述候选视频之间的内容重合时间段;根据所述内容重合时间段,从所述候选视频中选择与所述当前视频具有时间连续性的目标视频;在所述当前视频播放结束时,继续播放所述目标视频。本申请实施例通过确定与当前视频内容相关且具有时间连续性的目标视频,在当前视频播放结束后继续播放目标视频,从而实现了相关视频的连续性播放,解决了当前视频播放结束后出现播放间断的问题,满足了用户继续观看后续相关视频的需求。
-
公开(公告)号:CN113011345B
公开(公告)日:2024-03-05
申请号:CN202110304851.5
申请日:2021-03-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/16 , G06V20/40 , G06V10/774 , G06T7/00 , G06V10/82 , G06N3/0464
Abstract: 本申请提供了一种图像质量检测方法、装置、电子设备、可读存储介质,涉及计算机技术领域,具体涉及信息流和计算机视觉技术领域。具体实现方案为:提取待检测图像中所有人物的人物信息;基于人物信息确定各个人物在待检测图像中的重要性,获得第一检测结果;基于人脸截断模型和人物信息判断各个人物是否发生人脸截断,获得第二检测结果;其中,人脸截断模型是利用存在人脸截断的图像作为训练样本获得的模型;基于第一检测结果和第二检测结果获得待检测图像的质量检测结果。该方法可以使图像质量的检测结果更准确。
-
公开(公告)号:CN113627363B
公开(公告)日:2023-08-15
申请号:CN202110934269.7
申请日:2021-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种视频文件的处理方法、装置、设备以及存储介质,本公开涉及数据/图像处理技术领域,尤其涉及视频图像处理技术领域。具体实现方案为:确定视频文件的多个目标帧;确定多个目标帧中的每个目标帧的色调饱和度明度HSV空间特征;根据HSV空间特征,确定多个目标帧中的候选帧;确定候选帧的梯度特征;以及根据梯度特征,确定候选帧中的片头帧。
-
公开(公告)号:CN114241243B
公开(公告)日:2023-04-25
申请号:CN202111565672.3
申请日:2021-12-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/84
Abstract: 本公开提供了一种图像分类模型的训练方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习领域和图像处理领域,可应用于异常图像的检测场景等。图像分类模型的训练方法包括:采用已标注数据集对图像分类模型进行训练,得到初始模型;迭代地执行以下更新操作,直至更新后的初始模型达到收敛条件:采用初始模型从未标注数据中获得备选扩充数据;以及根据备选扩充数据更新已标注数据集和初始模型;其中,图像分类模型的训练方法还包括在在迭代地执行更新操作的过程中:确定针对标注类别的预测概率低于第一预定概率的目标数据;以及周期性地采用目标数据更新已标注数据集。
-
公开(公告)号:CN114595780B
公开(公告)日:2022-12-20
申请号:CN202210255883.5
申请日:2022-03-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62 , G06V10/74 , G06V10/774
Abstract: 本公开提供了一种图文处理模型训练及图文处理方法、装置、设备及介质,涉及人工智能领域,具体涉及深度学习领域,可用于信息推荐场景。具体实现方案为:将样本文本输入待训练的文本特征提取器得到文本特征,并将样本图像输入待训练的图像特征提取器得到图像特征;根据所述文本特征和所述图像特征之间的相关性,对所述文本特征提取器和所述图像特征提取器的网络参数进行更新;根据所述图像特征和所述样本图像构建监督信号,并根据所述监督信号更新所述图像特征提取器的网络参数。本公开能够提高图像特征提取器的特征提取准确度,从而提高图文相关性判断的准确度。
-
公开(公告)号:CN114926847A
公开(公告)日:2022-08-19
申请号:CN202111478344.X
申请日:2021-12-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V30/40 , G06F40/263 , G06K9/62 , G06V30/246 , G06V10/74 , G06V10/764
Abstract: 本公开提供了一种少数类语言的图像处理方法、装置、设备和存储介质,涉及人工智能技术领域,具体为自然语言处理、深度学习技术领域。具体实现方案为:获取少数类语言中的少数类字符元素;采用所述少数类字符元素构建少数类伪文本;将所述少数类伪文本转换为图像格式,并根据图像转换结果得到少数类语言图像。本公开实施例能够对少数类语言的处理效率。
-
公开(公告)号:CN114333038A
公开(公告)日:2022-04-12
申请号:CN202210200453.3
申请日:2022-03-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/16 , G06V10/26 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种对象识别模型的训练方法和对象识别方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及计算机视觉领域和深度学习领域,可应用于人脸识别和内容审核等场景下。对象识别模型的训练方法的具体实现方案为:检测包括完整结构的目标对象的第一样本图像,得到目标对象的关键点信息;根据关键点信息裁剪第一样本图像,得到针对目标对象的多个区域图像,每个区域图像包括目标对象的残缺结构;将多个区域图像分别与预定背景图像融合,得到多个第二样本图像;以及根据多个第二样本图像对目标检测模型进行训练。
-
-
-
-
-
-
-
-
-