-
公开(公告)号:CN114241374B
公开(公告)日:2022-12-13
申请号:CN202111530235.8
申请日:2021-12-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V20/40 , G06V10/25 , G06V10/774 , G06V10/82 , G06N3/04
Abstract: 本公开提供了直播处理模型的训练方法和装置、直播处理方法和装置,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:从直播图像中提取候选样本图像;采用直播处理模型,对所述候选样本图像进行处理得到候选样本图像的处理结果;所述直播处理模型包括直播检测模型和直播分类模型,所述候选样本图像的处理结果包括候选样本图像的检测结果和分类结果;根据所述候选样本图像的处理结果,从所述候选样本图像中确定目标样本图像,并采用所述目标样本图像对所述直播处理模型进行训练。本公开可以提高对直播处理模型的训练效率和识别准确度。
-
公开(公告)号:CN113011345B
公开(公告)日:2024-03-05
申请号:CN202110304851.5
申请日:2021-03-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/16 , G06V20/40 , G06V10/774 , G06T7/00 , G06V10/82 , G06N3/0464
Abstract: 本申请提供了一种图像质量检测方法、装置、电子设备、可读存储介质,涉及计算机技术领域,具体涉及信息流和计算机视觉技术领域。具体实现方案为:提取待检测图像中所有人物的人物信息;基于人物信息确定各个人物在待检测图像中的重要性,获得第一检测结果;基于人脸截断模型和人物信息判断各个人物是否发生人脸截断,获得第二检测结果;其中,人脸截断模型是利用存在人脸截断的图像作为训练样本获得的模型;基于第一检测结果和第二检测结果获得待检测图像的质量检测结果。该方法可以使图像质量的检测结果更准确。
-
公开(公告)号:CN113627363B
公开(公告)日:2023-08-15
申请号:CN202110934269.7
申请日:2021-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种视频文件的处理方法、装置、设备以及存储介质,本公开涉及数据/图像处理技术领域,尤其涉及视频图像处理技术领域。具体实现方案为:确定视频文件的多个目标帧;确定多个目标帧中的每个目标帧的色调饱和度明度HSV空间特征;根据HSV空间特征,确定多个目标帧中的候选帧;确定候选帧的梯度特征;以及根据梯度特征,确定候选帧中的片头帧。
-
公开(公告)号:CN114241243B
公开(公告)日:2023-04-25
申请号:CN202111565672.3
申请日:2021-12-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/84
Abstract: 本公开提供了一种图像分类模型的训练方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习领域和图像处理领域,可应用于异常图像的检测场景等。图像分类模型的训练方法包括:采用已标注数据集对图像分类模型进行训练,得到初始模型;迭代地执行以下更新操作,直至更新后的初始模型达到收敛条件:采用初始模型从未标注数据中获得备选扩充数据;以及根据备选扩充数据更新已标注数据集和初始模型;其中,图像分类模型的训练方法还包括在在迭代地执行更新操作的过程中:确定针对标注类别的预测概率低于第一预定概率的目标数据;以及周期性地采用目标数据更新已标注数据集。
-
公开(公告)号:CN113705370A
公开(公告)日:2021-11-26
申请号:CN202110909967.1
申请日:2021-08-09
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了直播间违规行为的检测方法、装置、电子设备和存储介质,涉及互联网移动端应用技术领域。在对待检测视频进行抽帧,得到若干个视频帧后,再将若干个视频帧依次输入违规行为检测模型,以确定视频帧中是否存在违规行为,并对违规行为进行异常标记,若根据第一视频帧的异常标记确定第一视频帧存在第一违规行为,根据第二视频帧的异常标记确认第二视频帧是否存在第二违规行为,其中,第二视频帧为若干视频帧中第一视频帧的上一视频帧,最后在确定第二视频帧存在第二违规行为后,根据第一违规行为及第二违规行为确定待检测视频存在直播间违规行为,该检测方法通过多帧融合机制,确保了直播间违规行为检测的准确率。
-
公开(公告)号:CN113627363A
公开(公告)日:2021-11-09
申请号:CN202110934269.7
申请日:2021-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种视频文件的处理方法、装置、设备以及存储介质,本公开涉及数据/图像处理技术领域,尤其涉及视频图像处理技术领域。具体实现方案为:确定视频文件的多个目标帧;确定多个目标帧中的每个目标帧的色调饱和度明度HSV空间特征;根据HSV空间特征,确定多个目标帧中的候选帧;确定候选帧的梯度特征;以及根据梯度特征,确定候选帧中的片头帧。
-
公开(公告)号:CN111476871A
公开(公告)日:2020-07-31
申请号:CN202010256117.1
申请日:2020-04-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开实施例公开了用于生成视频的方法和装置。该方法的一具体实施方式包括:从所接收的动漫风格视频中获取目标动漫人物的动漫人脸图像序列,以及基于动漫人脸图像序列生成动漫人脸轮廓图序列;基于动漫人脸轮廓图序列和所接收的真实人脸的初始人脸图像,生成针对真实人脸的人脸图像序列;根据人脸图像序列,生成针对真实人脸的动漫风格图像序列;使用动漫风格人脸图像序列中的动漫风格人脸图像,替换动漫风格视频中目标动漫人物的人脸图像,生成真实人脸对应的动漫风格的视频。该实施方式实现了基于动漫风格视频和单张真实人脸的初始人脸图像自动生成真实人脸对应的动漫风格的视频。
-
公开(公告)号:CN111475618A
公开(公告)日:2020-07-31
申请号:CN202010245146.8
申请日:2020-03-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33 , G06F40/205 , G06F40/253 , G06N3/08
Abstract: 本公开实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:接收待纠错文本;将上述待纠错文本输入预先建立的文本纠错模型,得到纠错后文本,其中,上述文本纠错模型是通过以下方式训练得到的:基于从预先获取的样本集中选取的样本进行第一次前向传播,得到第一损失,其中,样本包括样本待纠错文本和与样本待纠错文件对应的样本纠错后文本;确定噪声信息;基于上述噪声信息和所选取的样本进行第二次前向传播,得到第二损失;基于上述第一损失和上述第二损失,调整文本纠错模型的模型参数。该实施方式提升了文本纠错模型的整体性能,使生成的纠错后文本更加准确。
-
公开(公告)号:CN111429338A
公开(公告)日:2020-07-17
申请号:CN202010193393.8
申请日:2020-03-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T3/00 , G06T5/50 , G06K9/00 , H04N21/234
Abstract: 根据本公开的实施例,提供了用于处理视频的方法、装置、设备和计算机可读存储介质,涉及数据处理领域。该方法包括接收用于调整视频的至少一个帧中的第一对象的目标部位的请求,请求包括第二对象的目标部304第一对象的目标部位相对应的特征模板,特征模板包括第一对象的目标部位的特征的属性。该方法还包括基于位置信息和特征模板,确定针对第一对象的目标部位的至少一个替换图像。该方法还包括利用至少一个替换图像,调整至少一个帧中的第一对象的目标部位。通过该方法,可以使得用户能够快速方便地调整视频中的对象的目标部位,提高了视频处理效率。
-
公开(公告)号:CN109982106A
公开(公告)日:2019-07-05
申请号:CN201910357558.8
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/232 , H04N21/466 , H04N21/435 , H04N21/81 , H04N21/858
Abstract: 本发明提供一种视频推荐方法、服务器、客户端及电子设备,该方法包括:获取图片信息;确定预先获取的映射关系中与所述图片信息匹配的目标关键帧,并获取包括所述目标关键帧的目标视频;其中,所述映射关系包括所述目标关键帧与目标视频之间的对应关系;向客户端发送所述目标视频的信息。这样,服务器将与图片信息相匹配的目标视频发送给客户端,以为用户推荐与图片信息相匹配的视频,节省用户根据图片信息进行手动查找视频的时间,提高了视频获取效率。
-
-
-
-
-
-
-
-
-