-
公开(公告)号:CN114359811A
公开(公告)日:2022-04-15
申请号:CN202210029315.3
申请日:2022-01-11
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种数据鉴伪方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域,可应用人脸识别等场景。具体实现方案为:按照预定帧抽取模式,从视频数据中确定多个视频帧;对多个视频帧进行鉴伪处理,确定多个初始鉴伪结果,多个初始鉴伪结果与多个视频帧一一对应;以及根据接收到的与视频数据相关的结果类型信息,基于多个初始鉴伪结果,确定与结果类型信息相匹配的鉴伪结果。
-
公开(公告)号:CN110517214B
公开(公告)日:2022-04-12
申请号:CN201910799782.2
申请日:2019-08-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取待处理人脸图像和目标人脸图像,其中,该待处理人脸图像中包括第一人脸图像和第一人脸图像的人脸关键点信息;将该人脸关键点信息输入至预设的人脸姿态估计模型,生成人脸姿态信息,其中,该人脸姿态估计模型用于表征人脸关键点信息与人脸姿态信息之间的对应关系;根据该人脸姿态信息,确定人脸图像融合系数;基于该人脸图像融合系数对该目标人脸图像和该第一人脸图像进行融合,生成第二人脸图像。该实施方式实现了针对人脸不同姿态对图像融合的方式进行调整,从而提升图像融合的效果。
-
公开(公告)号:CN110516598B
公开(公告)日:2022-03-01
申请号:CN201910797619.2
申请日:2019-08-27
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取底版图像和目标人脸图像,其中,该底版图像包括待替换人脸图像和背景;从与该待替换人脸图像匹配的预设人脸图像库中确定匹配人脸图像,其中,该匹配的预设人脸图像库中包括该待替换人脸图像所指示的人脸的不同面部姿态的人脸图像,该匹配人脸图像用于表征待替换人脸图像所显示的面部姿态与该目标人脸图像所显示的面部姿态一致;基于该匹配人脸图像对该待替换人脸图像的替换,生成目标图像,其中,该目标图像包括与该匹配人脸图像相一致的人脸图像和与该底版图像相一致的背景。该实施方式提升了生成与目标人脸图像的面部姿态相一致的图像的速度。
-
公开(公告)号:CN110377591B
公开(公告)日:2022-02-25
申请号:CN201910506752.8
申请日:2019-06-12
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/215 , G06K9/62 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
-
公开(公告)号:CN114051105A
公开(公告)日:2022-02-15
申请号:CN202111320124.4
申请日:2021-11-09
Applicant: 北京百度网讯科技有限公司
IPC: H04N5/265 , H04N5/262 , G10L13/047 , G10L21/10 , G06V40/16
Abstract: 本公开提供了多媒体数据处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉等领域。具体实现方案为:根据参考视频数据中的参考音频数据,获得合成音频数据;将所述合成音频数据与所述参考音频数据进行映射,获得映射结果;根据所述映射结果,以及所述参考音频数据和所述参考视频数据的视频数据帧之间的映射关系,生成合成视频数据,所述合成视频数据中的音频数据为所述合成音频数据。本公开实施例能够为语音驱动人脸技术的使用和改进提供高度匹配的素材。
-
公开(公告)号:CN114004809A
公开(公告)日:2022-02-01
申请号:CN202111279502.9
申请日:2021-10-29
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种皮肤图像处理方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域。皮肤图像处理方法包括:对原始皮肤图像进行滤波处理,得到至少一个滤波后的图像;基于至少一个滤波后的图像,得到镜面反射图像,其中,镜面反射图像包括皮肤的表层信息;基于原始皮肤图像和镜面反射图像,得到漫反射图像,其中,漫反射图像包括皮肤的肌底层信息;处理漫反射图像,得到至少一个肌底层图像,其中,至少一个肌底层图像表征了皮肤肌底层的色素特征。
-
公开(公告)号:CN113742483A
公开(公告)日:2021-12-03
申请号:CN202110994014.X
申请日:2021-08-27
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种文档分类的方法、装置、电子设备和存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景下。具体实现方案为:一种文档分类的方法,包括:获取待处理文档包括的文本的文本信息和图像信息;基于所述文本信息和所述图像信息进行融合得到融合特征;根据所述融合特征获取所述文本的特征序列;基于预先定义的文档类别和所述特征序列,确定所述待处理文档的类别。本公开提供的技术方案解决了文档分类中的文档混淆的技术问题,提升了分类的精度。
-
公开(公告)号:CN113361523A
公开(公告)日:2021-09-07
申请号:CN202110699576.1
申请日:2021-06-23
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了文本确定方法、装置、电子设备和计算机可读存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市、智慧金融场景下。具体实现方案为:确定原始图像的图像特征数据;基于图像特征数据,确定原始图像中包括的多个字符的字符特征数据;基于字符特征数据,确定多个字符的分类信息;以及通过基于多个字符的分类信息确定由多个字符组成的备选文本,确定对应于备选文本的目标文本。以此方式,本公开的技术方案可以在对没有提供足够视觉信息的原始图片进行文本识别时提供较高的识别正确率。
-
公开(公告)号:CN113343982A
公开(公告)日:2021-09-03
申请号:CN202110666465.0
申请日:2021-06-16
Applicant: 北京百度网讯科技有限公司
IPC: G06K9/32 , G06K9/34 , G06K9/46 , G06K9/62 , G06K9/72 , G06N3/04 , G06N3/08 , G06F40/247 , G06F40/295
Abstract: 根据本公开的实施例,提供了一种多模态特征融合的实体关系提取的方法、装置、设备、介质和程序产品。涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景。方案为:针对包括字符的图像中的多个区域中的每个区域,确定区域的视觉特征和区域的多个字符文本特征,字符文本特征对应于区域中的一个字符;针对每个区域,基于区域的视觉特征和多个字符文本特征,确定区域的区域视觉语义特征;基于区域视觉语义特征,确定多个区域的关系信息,关系信息至少指示多个区域中的任意两个区域之间的关联程度;基于关系信息,将多个区域中的区域相关联;针对获取的实体,提取实体关系。由此能够提升文本识别的准确率。
-
公开(公告)号:CN112784751A
公开(公告)日:2021-05-11
申请号:CN202110090986.6
申请日:2021-01-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图像识别模型的训练方法、装置、设备以及介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、图像处理技术领域,可应用于OCR场景。该图像识别模型的训练方法包括:获取训练数据,其中,训练数据包括针对预设垂类的训练图像,训练图像包括包含预设垂类的真实数据的第一训练图像和包含预设垂类的虚拟数据的第二训练图像;构建基础模型,其中,基础模型包括深度学习网络,深度学习网络配置为对训练图像进行识别,以提取训练图像中的文本数据;以及使用训练数据训练基础模型,以得到图像识别模型。
-
-
-
-
-
-
-
-
-