-
公开(公告)号:CN111626119A
公开(公告)日:2020-09-04
申请号:CN202010328703.2
申请日:2020-04-23
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请实施例公开了目标识别模型训练方法、装置、设备以及存储介质,涉及人工智能技术领域。该方法的一具体实施方式包括:获取训练样本集,其中,训练样本集中的训练样本包括样本目标图像和样本目标特征;基于训练样本集中的训练样本之间的样本目标特征关系,构建有符号邻接矩阵;构建深度模型,以及基于有符号邻接矩阵构建图卷积神经网络;利用训练样本集对深度模型和图卷积神经网络进行有监督训练,得到目标识别模型。该实施方式提供了一种基于图卷积的目标识别技术,利用图卷积方法对特征空间进行优化,能够更有效地使类间距离增大而类内距离减小,从而显著提升了目标识别模型的性能。
-
公开(公告)号:CN110826507A
公开(公告)日:2020-02-21
申请号:CN201911096216.1
申请日:2019-11-11
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种人脸检测方法、装置、设备及存储介质,涉及计算机视觉技术领域。具体实现方案为:由用户终端基于用户终端的操作系统,对从图像采集器获取的原始图像进行处理得到目标图像;采用人脸识别深度学习模型对所述目标图像进行处理,得到所述目标图像中的人脸检测结果;其中所述人脸识别深度学习模型是基于跨平台编程语言实现的。本申请的技术方案,能够针对不同的操作系统,可支持跨平台编程语言的人脸检测操作,从而保证使用任何操作系统的用户终端都可正常使用应用程序中与人脸相关的功能。
-
公开(公告)号:CN110517214A
公开(公告)日:2019-11-29
申请号:CN201910799782.2
申请日:2019-08-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取待处理人脸图像和目标人脸图像,其中,该待处理人脸图像中包括第一人脸图像和第一人脸图像的人脸关键点信息;将该人脸关键点信息输入至预设的人脸姿态估计模型,生成人脸姿态信息,其中,该人脸姿态估计模型用于表征人脸关键点信息与人脸姿态信息之间的对应关系;根据该人脸姿态信息,确定人脸图像融合系数;基于该人脸图像融合系数对该目标人脸图像和该第一人脸图像进行融合,生成第二人脸图像。该实施方式实现了针对人脸不同姿态对图像融合的方式进行调整,从而提升图像融合的效果。
-
公开(公告)号:CN110503703A
公开(公告)日:2019-11-26
申请号:CN201910798510.0
申请日:2019-08-27
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取底版图像和目标人脸图像,其中,该底版图像包括待替换人脸图像和背景;将该目标人脸图像输入至预先训练的图像生成模型,生成匹配人脸图像,其中,该图像生成模型包括编码网络、隐层网络和解码网络,该匹配人脸图像用于表征待替换人脸图像所显示的面部姿态与该目标人脸图像所显示的面部姿态一致;基于该匹配人脸图像对该待替换人脸图像的替换,生成准目标图像;基于对该准目标图像的融合处理,生成目标图像,其中,该目标图像包括与该匹配人脸图像相一致的人脸图像和与该底版图像相一致的背景。该实施方式实现了面部表情的精确传递,提升了人脸图像生成的自然度。
-
公开(公告)号:CN110363810A
公开(公告)日:2019-10-22
申请号:CN201910515574.5
申请日:2019-06-14
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明提供一种建立图像检测模型的方法:获取训练数据;确定搜索空间;根据搜索空间构建当前网络结构序列并生成当前神经网络,依据训练数据获取当前神经网络的第一评估值;根据搜索空间随机替换当前网络结构序列中一个参数的值,得到待选网络结构序列并生成待选神经网络,依据训练数据获取待选神经网络的第二评估值;确定第一评估值与第二评估值是否满足预设条件,若否则将待选网络结构序列作为当前网络结构序列,并转至执行得到待选网络结构序列的步骤,以此循环进行,直至当前神经网络的第一评估值与待选神经网络的第二评估值满足预设条件,输出当前神经网络作为最终神经网络;利用训练数据训练最终神经网络,得到图像检测模型。
-
公开(公告)号:CN110188755A
公开(公告)日:2019-08-30
申请号:CN201910464140.7
申请日:2019-05-30
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明实施例提出一种图像识别的方法、装置和计算机可读存储介质,其中方法包括对输入图像进行文本识别,得到所述输入图像的文字信息及其位置;将所述输入图像的文字信息及其位置与预设的结构化模板中的关键特征进行匹配,得到各匹配对;基于各所述匹配对的位置关系,将所述输入图像的文字信息的位置调整为与所述结构化模板相同;从调整后的图像中提取所述文字信息。根据该变换矩阵将输入图像上的文字信息转换成与结构化模板一样的方向和大小,可以解决方向、旋转的问题。
-
公开(公告)号:CN110166560A
公开(公告)日:2019-08-23
申请号:CN201910441116.1
申请日:2019-05-24
Applicant: 北京百度网讯科技有限公司
IPC: H04L29/08
Abstract: 本发明实施例提出一种服务配置方法、装置、设备及存储介质,其中方法包括:根据服务对应的各个垂类的功能是否开放的信息,设置所述服务对应的各个垂类的有效性标识;其中,在所述垂类的功能开放的情况下,设置所述垂类的有效性标识的取值为有效;在所述垂类的功能不开放的情况下,设置所述垂类的有效性标识的取值为无效;将所述服务对应的各个垂类的有效性标识写入配置文件;生成包含所述配置文件的部署包。本发明实施例能够节约维护成本。
-
公开(公告)号:CN110147724A
公开(公告)日:2019-08-20
申请号:CN201910289541.3
申请日:2019-04-11
Applicant: 北京百度网讯科技有限公司
Abstract: 根据本公开的示例实施例,提供了一种用于检测视频中的文本区域的方法、装置、设备以及介质。方法包括基于第一图像帧中检测到的第一组文本区域来确定第一组文本区域的第一组跟踪特征,其中第一图像帧在视频的第一时刻被捕获,并且基于第一组跟踪特征来确定第一时刻之后的第二时刻的第二组预测特征。方法还包括基于第二图像帧中检测到的第二组文本区域来确定第二组文本区域的第二组跟踪特征,其中第二图像帧在视频的第二时刻被捕获,然后基于第二组预测特征和第二组跟踪特征来确定视频在第二时刻的一个或多个文本区域。本公开的实施例通过文本跟踪来辅助检测视频中的文本区域,能够建立视频图像帧间的时序联系,从而提高视频文本检测的准确率。
-
公开(公告)号:CN102982572B
公开(公告)日:2018-05-01
申请号:CN201210428871.4
申请日:2012-10-31
Applicant: 北京百度网讯科技有限公司
Inventor: 韩钧宇
IPC: G06T11/60
Abstract: 本发明提供了一种智能化的图像编辑方法和装置,其中,方法包括:预先建立图像编辑模板库,其中的图像编辑模板设置有描述标签和图像编辑策略;S1、根据用户输入的信息获取关键编辑信息;S2、根据关键编辑信息查询图像编辑模板库,与各描述标签进行匹配,并获取匹配得到的描述标签对应的图像编辑模板;S3、根据图像编辑模板中的图像编辑策略编辑目标图像。本发明能够根据用户输入的信息,智能化的获取用户的编辑意图,并选取匹配的图像编辑模板来对目标图像进行编辑处理。
-
公开(公告)号:CN102930262B
公开(公告)日:2017-07-04
申请号:CN201210350550.7
申请日:2012-09-19
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明提供了一种从图像中提取文字行的方法及装置,其中从图像中提取文字行的方法包括:A.对图像进行二值化处理,以得到所述图像的各个连通域;B.对不满足第一统计特征的连通域进行过滤,其中所述第一统计特征是对标注好的样本中提取的连通域描述特征进行统计学习后得到的属于文字连通域的统计特征;C.从过滤后的各个连通域中提取所述图像中的文字行。通过上述方式,本发明可以大大提高从图像中提取的文字行的准确性。
-
-
-
-
-
-
-
-
-