三维网格编码、解码方法及编码、解码装置

    公开(公告)号:CN101626509A

    公开(公告)日:2010-01-13

    申请号:CN200910091152.6

    申请日:2009-08-10

    Abstract: 本发明涉及一种三维网格编码、解码方法及编码、解码装置。编码方法包括以下步骤:生成原始几何图像、第一法向量纹理图像;根据所述原始几何图像的码流生成第一预测法向量纹理图像;计算第一法向量纹理图像的预测残差;生成所述预测残差的码流,并输出所述原始几何图像的码流和所述预测残差的码流。编码装置包括:生成模块,第一编码模块,第一预测模块,第一计算模块,第二编码模块。其中解码方法和装置分别对应于编码方法和装置。本发明提供的编码、解码方法及编码、解码装置通过几何图像和法向量纹理图像的预测残差重构三维网格,在保证相同码流大小的情况下,提高了三维网格所表现的渲染效果。

    一种基于任务提示注意力网络的类增量图像分类方法

    公开(公告)号:CN119851029A

    公开(公告)日:2025-04-18

    申请号:CN202411991661.5

    申请日:2024-12-31

    Abstract: 本发明公开了一种基于任务提示注意力网络的类增量图像分类方法,该方法以Transformer为基础,采用多个多头自注意力模块作为特征提取器,然后使用设计的任务相关的注意力模块为每个任务保存特定的注意力权重,缓解了类增量图像分类设定中灾难性遗忘的问题。同时,通过引入该任务相关注意力模块,能够在保证不遗忘旧任务知识的同时学习新任务的知识,缓解了稳定性‑可塑性困境。本发明所提出的方法通过在框架中加入了一个较小的任务注意力模块,在保证效果的前提下仅增加了少量参数量,没有增大计算成本,综上,本发明的提出,有效地缓解了类增量图像分类中的灾难性遗忘,解决了稳定性‑可塑性困境,同时避免了模型参数存储成本过高的问题。

    一种基于掩码金字塔增强的弱监督时序动作定位方法

    公开(公告)号:CN119723673A

    公开(公告)日:2025-03-28

    申请号:CN202411917926.7

    申请日:2024-12-24

    Abstract: 本发明公开了一种基于掩码金字塔增强的弱监督时序动作定位方法,属于计算机视觉、动作定位领域。实现该方法的系统模块包括特征提取模块、用于动作完整性学习的掩码金字塔分类模块MPCM,以及用于特征判别性学习的注意力模块FDAM。特征提取模块是用于特征提取,作为后续环节的输入数据;MPCM利用时序自适应增强机制TAEM构建精细化增强的掩码金字塔,并在层级处理时引入掩码策略驱动模型挖掘与目标动作互补的新特征区域。对不同层级的分类结果进行感知融合生成增强类激活序列CAS。MPENet在FDAM中引入互斥损失,帮助模型专注于目标动作的关键部分,从而引导模型学习适当的注意力分布,提高模型对特征的理解和区分能力。最后,将CAS与注意力加权得到模型的预测结果。

    一种基于边信息自回归的学习图像压缩方法

    公开(公告)号:CN119603465A

    公开(公告)日:2025-03-11

    申请号:CN202411743521.6

    申请日:2024-11-30

    Abstract: 本发明公开了一种基于边信息自回归的学习图像压缩方法,以自然图像x为输入,获得紧凑的潜在表示y,实际压缩图像x时直接编码y;将潜在表示y作为输入,获得边信息z,边信息z用来为潜在表示y的熵编码提供先验指导;使用边信息自回归模块估计边信息z的概率分布,熵编码后形成边信息z的压缩的比特流;将量化的边信息z送入超合成变换模块得到潜在表示y的超先验信息;利用潜在表示y的上下文和超先验信息估计潜在表示y的概率分布,熵编码后形成潜在表示y的压缩的比特流;将量化的潜在表示y送入合成变换模块得到最终重建图像#imgabs0#本发明所得到的重建图像在结构相似性客观指标上表现更加出色,主观质量上得到的重建图像纹理细节重建的更好。

    一种基于Retinex模型的卡通风格迁移方法

    公开(公告)号:CN113066114B

    公开(公告)日:2025-03-11

    申请号:CN202110305033.7

    申请日:2021-03-10

    Abstract: 一种基于Retinex模型的卡通风格迁移方法属于计算机视觉领域。将真实世界的照片转换成卡通风格的图像是一项有意义且具有挑战性的任务。现有方法由于没有分别考虑卡通图像和现实照片在结构、纹理和光照方面的一致性和连续性,不能得到令人满意的卡通化结果。本发明中Retinex模型联合学习照片和卡通图像的内在属性(形状和纹理)和外在属性(光照)。RexGAN框架包括通过反射损失来学习从照片图像到卡通图像的映射的ReflectGAN以及通过光照损失来进一步促进生成图像的结构和光照的LuminGAN。本发明不仅能够从真实照片中生成高质量的卡通图像,而且具有清晰的边缘和结构以及正确的照明,且在主观效果上优于目前最先进的方法。

    一种基于频域特征聚类与加权融合的电力负荷预测方法

    公开(公告)号:CN119561022A

    公开(公告)日:2025-03-04

    申请号:CN202411686077.9

    申请日:2024-11-24

    Abstract: 本发明公开了一种基于频域特征聚类与加权融合的电力负荷预测方法,利用傅里叶变换对电力负荷信号进行分解,提取不同频率分量的频域特征,然后对频域特征进行聚类处理,针对每个聚类类别,单独建立个性化的预测模型。在预测时,选择与目标预测序列最相似的若干个模型,采用加权平均的方式融合这些模型的预测结果。与现有的电力负荷预测方法相比,频率特征提取方法能够更好地捕捉电力负荷潜在的重要周期特征;聚类将具有相似频域特征的用户负荷数据聚类,从而更好地识别不同的用电模式;通过加权融合不同模型的预测结果,有效减少单个模型的误差,提高对噪声的抵抗力。

    基于图变换的动态多图卷积网络交通流量预测方法

    公开(公告)号:CN113935548B

    公开(公告)日:2025-02-25

    申请号:CN202111343972.7

    申请日:2021-11-14

    Abstract: 本发明公开了基于图变换的动态多图卷积网络交通流量预测方法,所依托的交通预测模型主要由四个模块组成:基于图变换的空间注意力模块、动态多图卷积模块、时间卷积模块和输出模块。基于图变换的空间注意力模块,由有稀疏矩阵的空间注意力机制模块和图变换模块组成。通过图变换模块构建不同的多图邻接矩阵从而捕获交通流的内在特性。时间卷积模块为了捕获交通数据流的时间特性,时间卷积模块由时间门控卷积和时间注意力机制两个模块组成。输出模块由两个Relu模块和两个线性模块组成,使用平均绝对误差为损失函数。本方法通过图变换构建多图以处理受多因素影响的交通流量数据,从而捕获交通数据的内在特性,使得交通预测更准确。

    一种基于局部几何一致性与特征一致性的点云补全方法

    公开(公告)号:CN114565738B

    公开(公告)日:2025-01-17

    申请号:CN202210195181.2

    申请日:2022-03-01

    Abstract: 本发明涉及一种基于局部几何一致性与特征一致性的点云补全方法,用于解决点云补全任务中补全结果细节丢失严重以及补全的点云分布不均匀的问题,具体方案包括:基于特征一致性的方法通过加强预测值与真实值之间对应局部区域点云分布的一致性,解决细节丢失问题;此外,在点云生成过程中,本发明采用“粗糙到细节”多阶段方式生成不同尺度的点云,所以,基于特征一致性的方法通过将不同尺度点云映射到特征空间,通过加强不同尺度点云在特征空间的一致性,使得不同尺度的点云在几何形状上更加一致,使得最终的补全结果更加接近真实值。本发明与现有的方法比,很大程度上克服了上述提及的问题,本发明具有明显的提升效果。

Patent Agency Ranking