-
公开(公告)号:CN113076932B
公开(公告)日:2023-08-04
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
公开(公告)号:CN111429338B
公开(公告)日:2023-08-01
申请号:CN202010193393.8
申请日:2020-03-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T3/00 , G06T5/50 , G06V40/16 , H04N21/234
Abstract: 根据本公开的实施例,提供了用于处理视频的方法、装置、设备和计算机可读存储介质,涉及数据处理领域。该方法包括接收用于调整视频的至少一个帧中的第一对象的目标部位的请求,请求包括第二对象的目标部304第一对象的目标部位相对应的特征模板,特征模板包括第一对象的目标部位的特征的属性。该方法还包括基于位置信息和特征模板,确定针对第一对象的目标部位的至少一个替换图像。该方法还包括利用至少一个替换图像,调整至少一个帧中的第一对象的目标部位。通过该方法,可以使得用户能够快速方便地调整视频中的对象的目标部位,提高了视频处理效率。
-
公开(公告)号:CN110059163B
公开(公告)日:2022-05-13
申请号:CN201910356347.2
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/186 , G06F40/30
Abstract: 本公开提供一种生成模板的方法,包括:确定多种类型的槽位以及每种类型的槽位对应的词库;模板扩展步骤:在预设的训练文本库中查找包括至少一个关键词的候选文本,用至少部分候选文本生成模板,候选文本中除关键词外的内容在由其生成的模板中转变为固定内容,候选文本中对应关键词的位置在由其生成的模板中转变为该关键词所在的词库对应的类型的槽位;关键词扩展步骤:在训练文本库中查找与模板具有匹配的固定内容的匹配文本,将匹配文本中对应模板中的槽位的词作为该类型的槽位的候选词,将至少部分候选词作为关键词加入该类型的槽位对应的词库中。本公开还提供一种生成模板的装置、电子设备、计算机可读介质。
-
公开(公告)号:CN114241374A
公开(公告)日:2022-03-25
申请号:CN202111530235.8
申请日:2021-12-14
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了直播处理模型的训练方法和装置、直播处理方法和装置,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:从直播图像中提取候选样本图像;采用直播处理模型,对所述候选样本图像进行处理得到候选样本图像的处理结果;所述直播处理模型包括直播检测模型和直播分类模型,所述候选样本图像的处理结果包括候选样本图像的检测结果和分类结果;根据所述候选样本图像的处理结果,从所述候选样本图像中确定目标样本图像,并采用所述目标样本图像对所述直播处理模型进行训练。本公开可以提高对直播处理模型的训练效率和识别准确度。
-
公开(公告)号:CN114241243A
公开(公告)日:2022-03-25
申请号:CN202111565672.3
申请日:2021-12-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本公开提供了一种图像分类模型的训练方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习领域和图像处理领域,可应用于异常图像的检测场景等。图像分类模型的训练方法包括:采用已标注数据集对图像分类模型进行训练,得到初始模型;迭代地执行以下更新操作,直至更新后的初始模型达到收敛条件:采用初始模型从未标注数据中获得备选扩充数据;以及根据备选扩充数据更新已标注数据集和初始模型;其中,图像分类模型的训练方法还包括在在迭代地执行更新操作的过程中:确定针对标注类别的预测概率低于第一预定概率的目标数据;以及周期性地采用目标数据更新已标注数据集。
-
公开(公告)号:CN109982106B
公开(公告)日:2021-11-26
申请号:CN201910357558.8
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/232 , H04N21/466 , H04N21/435 , H04N21/81 , H04N21/858
Abstract: 本发明提供一种视频推荐方法、服务器、客户端及电子设备,该方法包括:获取图片信息;确定预先获取的映射关系中与所述图片信息匹配的目标关键帧,并获取包括所述目标关键帧的目标视频;其中,所述映射关系包括所述目标关键帧与目标视频之间的对应关系;向客户端发送所述目标视频的信息。这样,服务器将与图片信息相匹配的目标视频发送给客户端,以为用户推荐与图片信息相匹配的视频,节省用户根据图片信息进行手动查找视频的时间,提高了视频获取效率。
-
公开(公告)号:CN113688887A
公开(公告)日:2021-11-23
申请号:CN202110931644.2
申请日:2021-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质,涉及图像处理、深度学习等人工智能技术领域。图像识别模型的训练方法包括:获取多张第一图像;根据所述多张第一图像中的标识图案,生成多张第二图像;根据所述多张第一图像与所述多张第二图像,构建图像集;使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。图像识别方法包括:获取待识别图像;将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案。本公开能够降低图像识别模型的训练成本,提升图像识别模型的识别准确性。
-
公开(公告)号:CN113076932A
公开(公告)日:2021-07-06
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
公开(公告)号:CN110798736B
公开(公告)日:2021-04-20
申请号:CN201911195372.3
申请日:2019-11-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/44 , H04N21/462
Abstract: 本申请公开了一种视频播放方法、装置、设备和介质,涉及人工智能技术领域。具体实现方案为:在当前视频播放过程中,确定与当前视频有内容重合的候选视频;确定所述当前视频与所述候选视频之间的内容重合时间段;根据所述内容重合时间段,从所述候选视频中选择与所述当前视频具有时间连续性的目标视频;在所述当前视频播放结束时,继续播放所述目标视频。本申请实施例通过确定与当前视频内容相关且具有时间连续性的目标视频,在当前视频播放结束后继续播放目标视频,从而实现了相关视频的连续性播放,解决了当前视频播放结束后出现播放间断的问题,满足了用户继续观看后续相关视频的需求。
-
公开(公告)号:CN112650885A
公开(公告)日:2021-04-13
申请号:CN202110090987.0
申请日:2021-01-22
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种视频分类方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域。实现方案为:对目标视频进行抽帧,以得到多个目标视频帧,所述多个目标视频帧包括时间标签;以及将所述多个目标视频帧输入训练好的神经网络模型,获取所述神经网络模型输出的所述目标视频的预测类别,所述预测类别能够表征所述目标视频是否包括未成年人。
-
-
-
-
-
-
-
-
-