一种基于用户提示的音频驱动数字人生成系统及方法

    公开(公告)号:CN118968579A

    公开(公告)日:2024-11-15

    申请号:CN202410903224.7

    申请日:2024-07-08

    Abstract: 本发明提出一种基于用户提示的音频驱动数字人生成系统及方法,其中系统包括:数据库模块、音频特征提取模块、AIGC生成人脸画像模块、Audioface模块、基于音频驱动的人脸图像模块和基于音频驱动的数字人动作生成模块。本发明实现了基于用户提示的音频驱动数字人生成,根据用户的输入提示实现内容生成,赋予了数字人高度的个性化特征和自然性行为表现,使得本发明具有重要的应用价值和前景,随着相关领域的不断发展和完善,本发明能为数字娱乐、虚拟现实、人机交互等领域带来更加丰富的体验和应用场景。

    一种利用异构知识蒸馏的高光谱图像超分辨率方法

    公开(公告)号:CN114092327B

    公开(公告)日:2024-06-07

    申请号:CN202111288667.2

    申请日:2021-11-02

    Abstract: 本发明提出一种利用异构知识蒸馏的高光谱图像超分辨率方法,给定一个低分辨率的高光谱图像输入ILR∈RL×H×W,经过浅层特征提取,在面向蒸馏的双分支模块DODB上的非线性映射,上采样过程,最终输出一个高分辨率的高光谱图像ISR∈RL×sH×sW;并使用异构知识蒸馏来提升模型性能,蒸馏作用于两个模型的2D特征之间,异构知识蒸馏问题转移到SHSR模型内部的融合问题,将传递的信息视为反馈信息,分别对每个频段的特征进行细化,将特征分为蒸馏部分和保留部分;在定量和定性上获得更好的性能,并重建相对高质量的高光谱图像。

    一种基于深度展开网络的空谱同时超分辨率重建方法

    公开(公告)号:CN114155145B

    公开(公告)日:2024-05-17

    申请号:CN202111338122.8

    申请日:2021-11-12

    Abstract: 本发明提供了一种基于深度展开网络的空谱同时超分辨率重建方法。步骤1:确定图像退化模型;步骤2:将单张图像超分和光谱超分的观测模型结合到空间光谱超分辨率模型中;步骤3:利用交替方向乘子法ADMM求解基于模型的能量函数;步骤4:将步骤3的ADMM算法的迭代过程展开成一个多级网络;步骤5:利用步骤4的多级网络解决在空间和光谱上产生超分辨率结果。本发明用以解决现有技术中空间分辨率和光谱分辨率不高的问题。

    基于零样本学习的多聚焦图像融合方法

    公开(公告)号:CN113313663A

    公开(公告)日:2021-08-27

    申请号:CN202110644185.X

    申请日:2021-06-09

    Abstract: 本发明提出基于零样本学习的多聚焦图像融合方法,使用多聚焦图像融合网络结构IM‑Net将输入的多聚焦图像中包含的信息进行融合,IM‑Net包括两个联合的子网络I‑Net和M‑Net,I‑Net对融合图像的深度先验建模,M‑Net对聚焦图的深度先验建模,通过提取的先验信息实现零样本学习,对IM‑Net施加了重构约束,以确保可以将源图像对的信息更好地传输到融合图像,高层语义信息可保持相邻像素的亮度一致性,并且引导损失为IM‑Net查找清晰区域提供了指导信息,实验结果表明了本发明方法的有效性。

    一种具有结构一致性的自监督多相机深度预测方法

    公开(公告)号:CN119228862A

    公开(公告)日:2024-12-31

    申请号:CN202411291373.9

    申请日:2024-09-14

    Abstract: 本发明提出一种具有结构一致性的自监督多相机深度预测方法,包括:S1:将相邻视角的RGB图像输入深度估计网络,获取对应RGB图像的深度基;S2:对RGB图像的深度基权重进行优化,并和深度基进行线性求和,得到初始深度图;S3:以初始深度图为基础,将相邻视角RGB图像的特征图像的特征投影到同一视角下,获取合并后的投影特征;S4:将合并后的投影特征输入权重更新网络进行优化;S5:对更新后的被投影特征权重和深度基进行线性求和计算,得到优化一次后的深度图;S6:重复S1‑S5,对深度图进行迭代优化,直至深度基权重收敛,得到自监督多相机协同深度预测结果。本发明能够利用相机之间的小重叠信息,实现深度预测的结构一致性。

    基于深度光学成像的隐私保护抑郁症识别方法、系统、计算机设备及介质

    公开(公告)号:CN118097745A

    公开(公告)日:2024-05-28

    申请号:CN202410175752.5

    申请日:2024-02-08

    Abstract: 本发明涉及一种基于深度光学成像的隐私保护抑郁症识别方法、系统、计算机设备及介质,该方法包括如下步骤:S1、构建光学模型,预训练带有隐私保护能力的透镜;S2、构建深度模型,并引入情感信息数据;S3、向光学模型和深度模型引入抑郁症信息数据;S4、融合情感信息与抑郁症信息并进行抑郁症水平预测。本发明通过设计基于深度光学的抑郁症识别模型,能够对面部图像进行抑郁症识别并且不产生任何隐私信息,同时确保识别的准确度。通过对比本模型与其他方法在识别性能与隐私保护性能的平衡上,本发明设计的模型具有最好的表现。与不同程度的图像模糊方法对比,本发明的隐私保护策略可以在保障识别误差的情况下,取得最佳的隐私保护性能。

    一种热力图感知的金字塔人脸超分辨率网络

    公开(公告)号:CN113344783A

    公开(公告)日:2021-09-03

    申请号:CN202110637474.7

    申请日:2021-06-08

    Abstract: 本发明公开了一种热力图感知的金字塔人脸超分辨率网络,属于人脸图像超分辨率技术领域。本发明设计了一种新颖的热力图感知卷积,该卷积可以针对人脸图像中不同区域生成空间变化的卷积核,从而有效地提高了重建性能。此外,为了恢复具有更好视觉质量和更饱满人脸细节的SR结果,采用了对抗损失和感知损失来微调模型。本发明充分利用了人脸结构的先验知识,在视觉效果和客观评价方面都达到了最先进的性能。

    一种支持通用设备与神经形态设备联合训练的系统及方法

    公开(公告)号:CN119272844A

    公开(公告)日:2025-01-07

    申请号:CN202411336905.6

    申请日:2024-09-25

    Abstract: 本发明提出一种支持通用设备与神经形态设备联合训练的系统及方法,其中系统包括:ANN客户端,SNN客户端、联邦学习中心服务器和ANN‑SNN转换模块;ANN客户端、SNN客户端和ANN‑SNN转换模块均与联邦学习中心服务器无线通信连接。本发明提供的支持ANN‑SNN异构训练的联邦学习框架,通过ANN‑SNN转换方法,首次克服了两种设备之间的异构性,能同时利用通用计算设备和神经形态硬件,且第一次支持将SNN和ANN两类不同的模型加入到联邦学习过程中。这使得框架能够充分利用两类客户端获取的边缘数据以支持训练,克服了设备异构导致数据利用率较低的问题。

    基于源视角几何约束的三维场景重建方法、系统、计算机设备及介质

    公开(公告)号:CN119251389A

    公开(公告)日:2025-01-03

    申请号:CN202411218444.2

    申请日:2024-09-02

    Abstract: 本发明涉及一种基于源视角几何约束的三维场景重建方法、系统、计算机设备及介质,该方法包括如下步骤:步骤一、构建基于源视角的三维场景几何表达,实现三维场景几何表达的规范化;步骤二、对三维空间中的采样点按照受各源视角的贡献程度进行转换,得到源视角的深度分布;步骤三、在步骤二所得到源视角的深度分布上施加损失函数,实现基于源视角几何约束的三维场景重建。该方法所构建的三维场景几何表达更加符合真实场景的几何形状,明显地改善了基于前推网络的三维场景重建方法对未知目标视角的生成效果,提升其与源视角的一致性。

    一种基于多任务交互学习的空谱同时超分辨率重建方法

    公开(公告)号:CN114219708B

    公开(公告)日:2024-11-26

    申请号:CN202111338491.7

    申请日:2021-11-12

    Abstract: 本发明公开了一种基于多任务交互学习的空谱同时超分辨率重建方法,属于图像处理与计算机视觉领域。包括以下步骤:步骤一、建立SSFIN网络架构;步骤二、使用权重衰减策略训练SSFIN。本发明的一种基于多任务交互学习的空谱同时超分辨率重建方法,使得空间超分分支和光谱超分分支可以受益于彼此,逐渐降低空间超分和光谱超分任务在总损失中的权重。可以去除可能仅对下游任务有用的信息,但为主要空谱联合超分任务保留更多空间和光谱信息。大大提高网络的特征学习能力。实验结果表明,所提出的SSSR框架优于最先进的两阶段方法。

Patent Agency Ranking