基于手绘草图的人体图像生成方法及系统

    公开(公告)号:CN112862920B

    公开(公告)日:2024-07-02

    申请号:CN202110190317.6

    申请日:2021-02-18

    申请人: 清华大学

    摘要: 本发明提供一种基于手绘草图的人体图像生成方法及系统,该方法包括:对手绘人体草图进行分割,得到分割后的手绘人体草图;对分割后的手绘人体草图进行几何形态改善处理,得到第一人体草图和第一解析图;将第一人体草图和第一解析图输入到训练好的结构改善模型中,得到第二人体草图和第二解析图,其中,训练好的结构改善模型是由标记有身体部件类型的样本身体部件边图,对姿态估计网络和空间变换网络进行训练得到的;将第二人体草图和第二解析图输入到训练好的人体图像合成模型中,得到人体合成图像。本发明能够改善手绘人体草图的局部几何结构和整体结构,生成更符合真实人像的几何形态和结构比例的图像。

    基于有向包围盒的目标检测方法、装置及电子设备

    公开(公告)号:CN117994561A

    公开(公告)日:2024-05-07

    申请号:CN202311814591.1

    申请日:2023-12-26

    申请人: 清华大学

    摘要: 本发明提供一种基于有向包围盒的目标检测方法、装置及电子设备,其中的方法包括:将待检测图像输入至预先训练的目标检测网络,得到预测输出;对预测输出进行解码处理,得到待检测图像的目标检测结果;其中,目标检测网络通过根据样本图像中目标的原始有向包围盒的编码结果进行训练优化得到。该方法通过在目标检测网络的训练过程中将原始有向包围盒编码为对应的水平外包围盒参数、滑动比例参数以及交并比参数,此过程不会因为细微扰动而导致编码结果出现明显的变化,具有良好的稳定性,且解码时准确地还原出原本的有向包围盒,实现了有向包围盒的稳定、准确编码、解码,进一步提升了图像目标检测的准确度。

    多尺度注意力机制方法及模块和图像处理方法及装置

    公开(公告)号:CN114897136A

    公开(公告)日:2022-08-12

    申请号:CN202210474867.5

    申请日:2022-04-29

    申请人: 清华大学

    摘要: 本发明提供一种多尺度注意力机制方法及模块和图像处理方法及装置,其中多尺度注意力模块中的分组卷积层用于对待处理特征图进行特征提取,获得第一特征图;每个尺度分支用于对第一特征图进行特征提取,获得各自的尺度分支特征图;相加单元用于将第一特征图和多个尺度分支特征图相加,获得第二特征图;普通卷积层用于对第二特征图进行特征提取,获得注意力图;矩阵逐元素相乘操作单元用于将注意力图和待处理特征图进行矩阵逐元素相乘操作,获得多尺度特征图;其中,多个尺度分支中至少两个尺度分支的特征提取尺度不同。本发明提供的多尺度注意力机制方法及模块和图像处理方法及装置,提高了图像处理的准确性和精度。

    一种人像抠图方法及系统
    7.
    发明公开

    公开(公告)号:CN114792325A

    公开(公告)日:2022-07-26

    申请号:CN202110099420.X

    申请日:2021-01-25

    申请人: 清华大学

    摘要: 本发明提供一种人像抠图方法及系统,该方法包括:获取待抠图的目标人像图片;将目标人像图片输入到训练好的深度神经网络模型中,输出得到目标人像图片中的人像前景,其中,训练好的深度神经网络模型是由标记有不透明度的样本人像图片和样本人像图片对应的样本三色图,对深度神经网络模型进行训练得到的。本发明提升了全自动人像抠图的精确度,使得处理大批量人像数据的效率提高,并且将分割与抠图步骤合并到一个统一的深度神经网络中,从而避免了传统的三色图交互方法中需要大量交互绘制工作量的弊端。

    一种基于网格细分结构的三维模型特征提取方法

    公开(公告)号:CN113593033A

    公开(公告)日:2021-11-02

    申请号:CN202110649502.7

    申请日:2021-06-10

    申请人: 清华大学

    IPC分类号: G06T17/20 G06N20/00

    摘要: 本发明提供一种基于网格细分结构的三维模型特征提取方法,包括:确定待提取特征的三维模型的网格表示;将所述三维模型的网格输入特征提取模块,输出特征提取后的目标网格表示,以及所述目标网格表示中每个面片的目标特征向量;其中,所述网格表示由多个三角面片或多个四角面片组成,用于刻画实物或场景的三维形状,所述特征提取模块包括依次连接的重网格化模块和网格上下采样模块。本发明提供的方法,提取的特征能更好地描述广范围特征,应用于网格分类、分割、检索、形状对应等,可提高准确度和健壮性。

    基于最长路融合算法的深度学习计算图优化方法

    公开(公告)号:CN113326869A

    公开(公告)日:2021-08-31

    申请号:CN202110502342.3

    申请日:2021-05-08

    申请人: 清华大学

    IPC分类号: G06K9/62 G06N3/08 G06F16/901

    摘要: 本发明公开了一种基于最长路融合算法的深度学习计算图优化方法,包括:1)使用最小代价子图划分估计深度学习计算图的算子融合的加速效果,2)根据代价函数近似得到出一种跨层算子融合规则,3)标记计算图边权,用动态规划求解算子最长路标号,4)使用并查集算法融合标号相同的算子。此方法在保证优化额外开销比较小的同时,显著提高深度学习框架的速度。

    用于坐式虚拟现实场景的头部重定向方法及装置

    公开(公告)号:CN113126760A

    公开(公告)日:2021-07-16

    申请号:CN202110393903.0

    申请日:2021-04-13

    申请人: 清华大学

    IPC分类号: G06F3/01

    摘要: 本发明提供一种用于坐式虚拟现实场景的头部重定向方法及装置,该方法包括:根据用户的第一头部位置信息和第二头部位置信息,获取用户当前时刻的头部转动方向和头部转动速度,所述第一头部位置信息为用户在当前时刻的头部位置信息,所述第二头部位置信息为用户在上一预设时间序列的头部位置信息;对所述头部转动方向进行判断,若所述头部转动方向与坐姿前向之间的夹角增大,则根据所述头部转动速度,获取虚拟现实场景第一放大倍数,以根据所述虚拟现实场景第一放大倍数进行头部重定向。本发明根据头部转动速度改变虚拟现实场景的放大倍速,能够让用户在头部转动速度不同时,体验到匹配更为合适的放大倍数,达到了较高的舒适性和效率。