-
公开(公告)号:CN114333038B
公开(公告)日:2022-06-07
申请号:CN202210200453.3
申请日:2022-03-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/16 , G06V10/26 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种对象识别模型的训练方法和对象识别方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及计算机视觉领域和深度学习领域,可应用于人脸识别和内容审核等场景下。对象识别模型的训练方法的具体实现方案为:检测包括完整结构的目标对象的第一样本图像,得到目标对象的关键点信息;根据关键点信息裁剪第一样本图像,得到针对目标对象的多个区域图像,每个区域图像包括目标对象的残缺结构;将多个区域图像分别与预定背景图像融合,得到多个第二样本图像;以及根据多个第二样本图像对目标检测模型进行训练。
-
公开(公告)号:CN113076480A
公开(公告)日:2021-07-06
申请号:CN202110432753.X
申请日:2021-04-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F16/955 , G06Q30/02
Abstract: 本公开提供了一种页面推荐方法、装置、电子设备、存储介质和计算机程序产品,涉及计算机领域,更具体地涉及内容推荐。一种页面推荐方法,包括:获取用于描述页面的源码数据;基于源码数据,确定页面的一个或多个显示区域;基于一个或多个显示区域中的每个显示区域中包括的页面元素,确定页面的页面推荐度;以及基于页面的页面推荐度控制是否将页面提供给终端设备。
-
公开(公告)号:CN113791837B
公开(公告)日:2023-08-11
申请号:CN202110925034.1
申请日:2021-08-12
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种页面处理方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及数据挖掘、网页搜索等技术领域。页面处理方法包括:基于页面间的跳转状态,获取存在跳转关系的页面,所述存在跳转关系的页面包括目标页面;获取所述目标页面的页面质量信息;基于所述目标页面的页面质量信息,对所述存在跳转关系的页面中的至少一个页面进行反作弊处理。本公开可以提高页面处理的准确度。
-
公开(公告)号:CN113076932B
公开(公告)日:2023-08-04
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
公开(公告)号:CN114241374A
公开(公告)日:2022-03-25
申请号:CN202111530235.8
申请日:2021-12-14
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了直播处理模型的训练方法和装置、直播处理方法和装置,涉及人工智能领域,尤其涉及计算机视觉和深度学习领域。具体实现方案为:从直播图像中提取候选样本图像;采用直播处理模型,对所述候选样本图像进行处理得到候选样本图像的处理结果;所述直播处理模型包括直播检测模型和直播分类模型,所述候选样本图像的处理结果包括候选样本图像的检测结果和分类结果;根据所述候选样本图像的处理结果,从所述候选样本图像中确定目标样本图像,并采用所述目标样本图像对所述直播处理模型进行训练。本公开可以提高对直播处理模型的训练效率和识别准确度。
-
公开(公告)号:CN114241243A
公开(公告)日:2022-03-25
申请号:CN202111565672.3
申请日:2021-12-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V10/764 , G06V10/774 , G06K9/62
Abstract: 本公开提供了一种图像分类模型的训练方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习领域和图像处理领域,可应用于异常图像的检测场景等。图像分类模型的训练方法包括:采用已标注数据集对图像分类模型进行训练,得到初始模型;迭代地执行以下更新操作,直至更新后的初始模型达到收敛条件:采用初始模型从未标注数据中获得备选扩充数据;以及根据备选扩充数据更新已标注数据集和初始模型;其中,图像分类模型的训练方法还包括在在迭代地执行更新操作的过程中:确定针对标注类别的预测概率低于第一预定概率的目标数据;以及周期性地采用目标数据更新已标注数据集。
-
公开(公告)号:CN113688887A
公开(公告)日:2021-11-23
申请号:CN202110931644.2
申请日:2021-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种图像识别模型的训练与图像识别方法、装置、电子设备和可读存储介质,涉及图像处理、深度学习等人工智能技术领域。图像识别模型的训练方法包括:获取多张第一图像;根据所述多张第一图像中的标识图案,生成多张第二图像;根据所述多张第一图像与所述多张第二图像,构建图像集;使用所述图像集与预设标签对神经网络模型进行训练,得到图像识别模型。图像识别方法包括:获取待识别图像;将所述待识别图像输入图像识别模型,得到所述图像识别模型输出的预测分值;在确定所述预测分值大于目标图像阈值的情况下,确定所述待识别图像中包含标识图案。本公开能够降低图像识别模型的训练成本,提升图像识别模型的识别准确性。
-
公开(公告)号:CN113688302A
公开(公告)日:2021-11-23
申请号:CN202111005656.9
申请日:2021-08-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951 , G06F16/958
Abstract: 本公开提供了一种页面数据分析方法、装置、设备和介质,涉及计算机领域,具体涉及计算机网络技术、搜索引擎技术和软件应用技术。该方法包括:确定目标页面中的多个页面节点;确定目标页面中的至少一个视觉区域,其中,至少一个视觉区域中的每一个视觉区域包括多个页面节点中的至少一个页面节点;针对至少一个视觉区域中的每一个视觉区域,基于该视觉区域所包括的至少一个页面节点,确定该视觉区域的得分;基于至少一个视觉区域各自的得分,确定重要视觉区域;以及对重要视觉区域进行分析。
-
公开(公告)号:CN113127365A
公开(公告)日:2021-07-16
申请号:CN202110468771.3
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F11/36 , G06F16/951 , G06F16/958 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了确定网页质量的方法、装置、电子设备和计算机可读存储介质,涉及互联网领域和人工智能领域,尤其涉及机器学习领域和智能推荐领域。具体实现方案为:基于从目标服务器获取的目标网页的页面文本信息,获取与页面文本信息中的展示元素相关联的用于渲染的配置信息;确定配置信息的特征数据;以及基于特征数据,确定与配置信息的质量相关联的质量信息。以此方式,本公开的技术方案可以在静态页面被渲染之前对目标网页的相关信息进行检测,从而实现页面数据质量的实时检测。
-
公开(公告)号:CN113076932A
公开(公告)日:2021-07-06
申请号:CN202110470368.4
申请日:2021-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开公开了训练音频语种识别模型的方法、视频检测方法及其装置,涉及人工智能领域,尤其涉及深度学习领域。具体实现方案为:从人声音频文件中获取多个音频片段;基于多个音频片段中包含非目标语种语音的音频片段,确定用于训练音频语种识别模型的第一样本数据集;基于多个音频片段中包含目标语种语音的音频片段,确定用于训练音频语种识别模型的第二样本数据集;以及基于第一样本数据集和第二样本数据集,训练音频语种识别模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频语种识别模型的训练,从而准确确定待测视频文件的检测结果。
-
-
-
-
-
-
-
-
-