一种基于拖拽的三维高保真人脸编辑方法和系统

    公开(公告)号:CN118521751A

    公开(公告)日:2024-08-20

    申请号:CN202410670275.X

    申请日:2024-05-28

    Abstract: 本发明提供一种基于拖拽的三维高保真人脸编辑方法和系统,包括:对输入图像进行拖拽,基于三平面特征面,进行三维一致的人脸变形;训练一个编码器,通过所述编码器消除所述人脸变形感知的扭曲;将原始图像与三维一致人脸变形后的图像输入所述编码器并作差得到方向向量,基于所述方向向量,对脸型或者表情进行编辑。本发明不再局限于现有技术中的图像可视部分的编辑,而是将图像变为三维模型,从多角度实现三维一致人脸编辑,通过使用关键点拖拽的方式实现编辑可以对人脸的脸型(朝向、脸型、五官)和表情进行编辑;操作更具可控性,更方便、直观。

    一种面向智能机器人离线视觉控制的强化学习系统

    公开(公告)号:CN118014052A

    公开(公告)日:2024-05-10

    申请号:CN202410164269.7

    申请日:2024-02-05

    Abstract: 本公开提供一种面向智能机器人离线视觉控制的强化学习系统,其包括:源域预训练模块,将源域的数据样本作为输入,源域预训练模块对源域智能体进行预训练处理,输出预训练完成的源域的世界模型、演员网络和评论员网络;域合作表征学习模块,将预设时刻的目标域智能体的视觉观测作为输入,输出经过对齐处理的目标域的隐空间表征和源域的隐空间表征;域合作行为学习模块,将源域的数据样本、目标域的数据样本、目标域智能体的视觉观测作为输入,输出目标域智能体的执行动作。通过本公开,采用易于交互的现成模拟器训练辅助的强化学习模型,为价值函数提供灵活的约束条件,缓解离散数据分布之外价值函数的高估问题,提高离线视觉环境下控制的准确性。

    融合场景相关性的目标检测方法、装置、介质及电子设备

    公开(公告)号:CN117935032A

    公开(公告)日:2024-04-26

    申请号:CN202410008660.8

    申请日:2024-01-04

    Abstract: 本公开提供一种融合场景相关性的目标检测方法、装置、介质及电子设备,融合场景相关性的目标检测方法,包括:获取待测图像所在垂直领域的图像数据集;根据图像数据集,确定垂直领域的场景类别和目标标签;根据垂直领域的场景类别和目标标签,确定场景类别和目标标签的联合分布概率;采用预训练的图像分类网络对待测图像进行分类检测,确定待测图像的场景类别的概率;采用预训练的目标检测网络对待测图像进行目标检测,确定待测图像的目标标签的检测概率;将联合分布概率、待测图像的场景类别的概率、待测图像的目标标签的检测概率进行融合处理,确定待测图像的目标检测结果。通过本公开,充分采用垂直领域的先验知识,提高目标检测的准确性。

    数据处理方法、流体视觉直觉学习数据采集与实验系统

    公开(公告)号:CN117634272A

    公开(公告)日:2024-03-01

    申请号:CN202311606624.3

    申请日:2023-11-28

    Abstract: 本发明提供一种数据处理方法、流体视觉直觉学习数据采集与实验系统,包括:获取视觉图像数据;通过神经辐射场技术,对视觉图像数据进行流体表面多视图3D重构,推断流体内部动力学模型,并反演流体属性;根据流体内部动力学模型和流体属性,进行仿真模拟。本发明从外部视觉表观推理到内部流体粒子动态,推导出流体内部动力学模型,该模型能够进行视觉数据的分析和处理,从而获得较为准确的流体渲染效果;利用渲染器获取渲染效果,并中间获取流体粒子数据,能够与其他可微分的流体粒子推理模型高度适配,能够高效地进行流体场景的数值模拟和场景自定义,实现单场景秒级别的单步模拟时间;整个过程计算时间大幅缩短,仿真速度显著提高。

    一种基于神经网络的图像雾浓度估计方法、系统和终端

    公开(公告)号:CN111539250B

    公开(公告)日:2024-02-27

    申请号:CN202010171560.9

    申请日:2020-03-12

    Abstract: 本发明提供一种基于神经网络的图像雾浓度估计方法、系统和终端,方法包括:采用卷积神经网络自动提取待测图像的特征;将提取的待测图像的所述特征采用最大池化层与卷积层进行特征映射;计算映射后的所述特征中的最大值和平均值,并将两者进行融合;对于融合后的特征进行激活;对激活得到的特征取平均,得到的结果为最后整幅图像的雾浓度。所述系统包括特征提取模块、特征映射模块、局部统计值集散模块和最大值均值融合模块。本发明能很好的预测雾浓度的大小,并且与人类的主观评价高度一致,可以对任意大小的雾图像进行雾浓度的估计。

    一种移动设备拍照清晰度质量评价方法、系统和终端

    公开(公告)号:CN111539913B

    公开(公告)日:2022-12-20

    申请号:CN202010211195.X

    申请日:2020-03-24

    Abstract: 本发明提供了一种移动设备拍照清晰度质量评价方法、系统和终端,方法首先选取图像纹理最为丰富的区域作为表征待评价图像清晰度质量的块状区域,然后计算该块状区域在空间域、频域和小波域上的纹理特征,最后利用机器学习的方法把块状区域的特征向量回归到主观的清晰度质量分数。本发明只选取图像纹理最为丰富的区域作为待评价的对象,可以有效的排除图像无关位置的影响,分别从空间域、频域和小波域上提取纹理特征,可以高效的表征图像清晰度的特征信息。

    基于注意力感知特征的全景图像显著性预测方法及系统

    公开(公告)号:CN111539420B

    公开(公告)日:2022-07-12

    申请号:CN202010171611.8

    申请日:2020-03-12

    Abstract: 本发明提供了一种基于注意力感知特征的全景图像显著性预测方法及系统,包括:预测全景图像的前景注意力图和背景注意力图;计算预测的所述前景注意力图、所述背景注意力图中每一部分的逐像素的亮度值,得到可视化分数;提取全景图像的全局特征,将所述全局特征与预测的所述前景注意力图、所述背景注意力图使用逐元素乘的方式进行融合,得到融合后的所述前景注意力图、所述背景注意力图;将融合后的所述前景注意力图、所述背景注意力图与所述可视化分数加权融合,获得最终的预测结果。本发明在模拟人类视觉注意力机制方面具有较好的准确性。

    基于模型结构组合搜索的目标检测系统及方法

    公开(公告)号:CN114139633A

    公开(公告)日:2022-03-04

    申请号:CN202111468456.7

    申请日:2021-12-03

    Abstract: 一种基于模型结构组合搜索的目标检测系统及方法,包括:输入模块、主干网络、特征融合网络单元和输出单元,其中:输入模块根据预制数据集将目标检测任务的数据输入待搜索模型结构;主干网络将原图片特征图经过多个卷积、下采样操作后,输出不同分辨率下的特征图并输入FPN;FPN根据提取出的不同维度的特征图信息进行融合,结合不同维度数据检测出物品及标定框,输出单元输出图内的待检测物品的标定框信息作为目标检测结果。本发明不需要在ImageNet数据集上进行预训练,极大的节约模型训练时间。

    基于自然音视频统计的无参考音视频联合质量评价方法

    公开(公告)号:CN111479107B

    公开(公告)日:2021-06-08

    申请号:CN202010171587.8

    申请日:2020-03-12

    Abstract: 本发明提供了的一种基于自然音视频统计的无参考音视频联合质量评价方法,该方法通过将相关的自然视频统计模型推广至自然音频统计,并进一步构建自然音频及视频联合统计模型,从而实现基于自然音频及视频统计的无参考音视频联合质量评价;包括:构建自然视频统计模型,将自然视频统计模型推广至自然音频统计,利用自然视频统计模型及自然音频统计模型构建自然音频及视频联合统计模型,提取基于自然音频统计、自然视频统计、及自然音视频联合统计的音视频质量特征,特征回归得到最终的音视频联合质量估计;本发明提供的无参考音视频联合质量评价方法,可有效地在原始音频及视频信号未知的情况下估计待测的音视频信号联合质量。

Patent Agency Ranking