皮肤光滑度的确定方法、装置和电子设备

    公开(公告)号:CN111507944B

    公开(公告)日:2023-07-04

    申请号:CN202010242706.4

    申请日:2020-03-31

    Abstract: 本申请公开了皮肤光滑度的确定方法、装置和电子设备,涉及计算机视觉技术领域。具体实现方案为:在计算皮肤光滑度时,先获取到包括人脸区域待检测图像,将待检测图像和待检测图像对应的光滑度分析掩膜图像输入至深度学习模型中,得到用于指示人脸的皮肤光滑度的多个特征向量,由于光滑度分析掩膜图像中不包括预设因素,且预设因素包括五官、反光、或者头发中的至少一种,避免了预设因素对皮肤光滑度的影响,在一定程度上保证了人脸皮肤光滑度的准确度,并且可以根据多个特征向量得到待检测图像中人脸的皮肤光滑度,实现了在保证准确度的情况下,提高了人脸皮肤光滑度的计算效率。

    数据处理方法、装置、电子设备、介质以及自动驾驶车辆

    公开(公告)号:CN115829898B

    公开(公告)日:2023-06-02

    申请号:CN202310159688.7

    申请日:2023-02-24

    Abstract: 本发明提供了一种数据处理方法、装置、电子设备、介质以及自动驾驶车辆,涉及人工智能技术领域。具体实现方案为:对视觉任务的二维视觉数据集和点云数据集进行特征提取,得到二维视觉特征图集和点云特征图集;将二维视觉特征图集和点云特征图集转换为目标特征空间的特征图,得到第一三维视觉特征图集和目标点云特征图集;根据二维视觉特征图集、第一三维视觉特征图集和目标点云特征图集,得到二维候选框集、第一三维候选框集和第二三维候选框集;根据二维候选框集、第一三维候选框集和第二三维候选框集,将二维视觉特征图集、第一三维视觉特征图集和目标点云特征图集进行融合,得到融合特征图集,实现了多模态特征融合。

    文本识别模型框架的训练方法、装置及系统

    公开(公告)号:CN113591864B

    公开(公告)日:2023-04-07

    申请号:CN202110858410.X

    申请日:2021-07-28

    Abstract: 本公开提供了一种文本识别模型框架的训练方法、装置及系统,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景。包括:基于预设的文本检测模型对样本图像进行特征处理,得到与样本图像中文本信息相关的至少两种特征信息,基于预设的特征融合模型对样本图像的至少两种特征信息进行融合处理,得到样本图像的融合特征,将融合特征输入至特征融合模型,基于融合特征模型对文本检测模型和特征融合模型的参数分别进行调整,得到文本识别模型框架,文本识别模型框架中的文本检测模型与特征融合模型之间具有较高的关联性,从而实现了训练过程的完整性和全面性,提高了文本识别模型框架的准确性和可靠性。

    多视角图像的视角转换方法、装置、设备和介质

    公开(公告)号:CN115866229A

    公开(公告)日:2023-03-28

    申请号:CN202310168244.X

    申请日:2023-02-14

    Abstract: 本公开提供了一种多视角图像的视角转换方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、无人驾驶等场景。具体实现方案为:提取多视角图像的图像特征得到各视角图像的特征图,将特征图作为值;根据特征图构建各视角图像在对应的相机视角的局部3D坐标系下的局部键;根据全局坐标系到各视角的相机坐标系的转换关系,构建各视角图像在局部3D坐标系下的局部查询;将值、局部键和局部查询,以及全局坐标系下的全局键和全局查询,输入transformer网络的解码器,通过解码器得到多视角图像在全局坐标系下的图像特征。本公开可以降低transformer网络的学习难度,从而提高视角转换精度。

    图像深度处理方法、装置、电子设备及介质

    公开(公告)号:CN115578431A

    公开(公告)日:2023-01-06

    申请号:CN202211268979.1

    申请日:2022-10-17

    Abstract: 本公开提供了一种图像深度处理方法、装置、电子设备及介质,涉及人工智能技术领域,具体为计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于自动驾驶、智能交通、智慧城市、元宇宙等场景。具体实现方案为:基于目标对象在待预测图像中的对象位置信息,确定所述目标对象的深度敏感区域;确定所述深度敏感区域中至少两个目标像素的深度预测值,以及所述目标像素在所述深度敏感区域中的像素位置信息;根据所述目标像素的所述深度预测值和所述像素位置信息,确定所述目标对象的深度预测值。本公开可以提高待预测图像中目标对象的深度预测准确性。

    文本识别方法、文本识别模型的训练方法及装置

    公开(公告)号:CN114283411B

    公开(公告)日:2022-11-15

    申请号:CN202111560326.6

    申请日:2021-12-20

    Abstract: 本公开提供了一种文本识别方法、文本识别模型的训练方法及装置,应用于工智能技术领域,具体为深度学习、计算机视觉技术领域,文本识别方法包括:获取待识别图像的图像序列特征,对所述图像序列特征进行解码处理,得到待识别图像的全量的文本字符串,对文本字符串进行语义增强处理,得到文本序列特征,其中,图像序列特征、文本字符串与文本序列特征的长度相同,根据文本字符串和文本序列特征,确定待识别图像的文本内容,使得识别过程更加全面和完善,不仅充分考虑了用以确定文本内容的元素的完整性和全面性,且考虑了用以确定文本内容的元素在语义理解层面的内容,从而实现了文本识别的准确性、有效性、以及可靠性的技术效果。

    训练图像特征提取模型和提取图像特征的方法、装置

    公开(公告)号:CN113255694B

    公开(公告)日:2022-11-11

    申请号:CN202110555863.5

    申请日:2021-05-21

    Abstract: 本公开提供了训练图像特征提取模型和提取图像特征的方法、装置,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理场景下。具体实现方案为:获取样本集和初始图像特征提取模型;从样本集中选取样本,执行如下训练步骤:将选取的样本的物品图像输入主干模型,得到图像特征向量;将图像特征向量分别与选取的样本的目标类别对应的预定数目的子中心向量计算相似度,并将相似度最大值作为目标类别的相似度;基于目标类别的相似度计算损失值;若损失值小于预定阈值,则确定出初始图像特征提取模型训练完成。通过该实施方式能够提高特征提取模型的训练速度和准确度,减少对精标数据的依赖。

    信息处理方法、信息处理装置、电子设备和存储介质

    公开(公告)号:CN112052835B

    公开(公告)日:2022-10-11

    申请号:CN202011057666.2

    申请日:2020-09-29

    Abstract: 本申请公开了一种信息处理方法、信息处理装置、电子设备和计算机可读存储介质,涉及计算机视觉、深度学习、自然语言处理等人工智能领域。在本公开的信息处理方法中,计算设备可以首先识别图像中的多个文本项。然后,计算设备可以基于多个文本项的语义,将多个文本项划分为名称文本项的第一集合和内容文本项的第二集合。接着,计算设备可以基于多个文本项在图像中的布置,执行第一集合和第二集合的匹配,以确定与第一集合的名称文本项匹配的第二集合的内容文本项。然后,计算设备可以输出匹配的名称文本项和内容文本项。本公开的实施例可以提高用于识别和提取图像中的结构化信息的方法或系统的性能。

    用于确定字符序列的方法、装置和电子设备

    公开(公告)号:CN113361522B

    公开(公告)日:2022-05-17

    申请号:CN202110698215.5

    申请日:2021-06-23

    Abstract: 本公开提供了用于确定字符序列的方法、装置、电子设备和计算机可读存储介质,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市、智慧金融场景下。具体实现方案为:确定原始图像的图像特征数据;基于图像特征数据确定第一字符特征数据,第一字符特征数据至少包括原始图像中包括的多个字符的相应字符特征数据;基于第一字符特征数据,确定由多个字符组成的目标字符序列;从目标字符序列中获取第二字符特征数据,第二字符特征数据包含字符特征信息和字符序列特征信息;以及基于图像特征数据和第二字符特征数据,确定多个字符的更新的目标字符序列。本公开提升了字符序列识别结果的正确率,改善了用户体验。

Patent Agency Ranking