基于时空超分辨率和神经辐射场的三维场景渲染方法

    公开(公告)号:CN119399337A

    公开(公告)日:2025-02-07

    申请号:CN202411452920.7

    申请日:2024-10-17

    Abstract: 本发明公开了一种基于时空超分辨率和神经辐射场的三维场景渲染方法,属于三维场景重建领域,该方法包括以下步骤:将多视图图像输入神经辐射场得到目标帧低分辨率图像和支持帧低分辨率图像;对目标帧低分辨率图像进行上采样处理得到第一分支的目标帧高分辨率图像;基于目标帧低分辨率图像和支持帧低分辨率图像采用视频插值网络处理并进行图像投影得到第二分支的目标帧高分辨率图像;将第一分支的目标帧高分辨率图像和第二分支的目标帧高分辨率图像输入轻量级神经渲染器得到目标三维场景。

    基于视觉大模型的重量估计方法
    12.
    发明公开

    公开(公告)号:CN119379652A

    公开(公告)日:2025-01-28

    申请号:CN202411511389.6

    申请日:2024-10-28

    Abstract: 本发明公开了一种基于视觉大模型的重量估计方法,包括:获取多模态重量数据集,构建视觉语言模型,基于所述多模态重量数据集对所述视觉语言模型进行两个阶段的训练;基于所述多模态重量数据集获得微调数据集;基于微调数据集、类别引导策略和参考校准策略对完成第二阶段训练的视觉语言模型获得重量估计模型;基于重量估计模型与待评估的物体图像进行重量估计。本发明通过类别引导策略和参考校准策略有效提升了视觉大模型的重量估计精度和重量推理能力。

    基于任务型对话的图像编辑系统

    公开(公告)号:CN116450784B

    公开(公告)日:2024-09-27

    申请号:CN202310118446.3

    申请日:2023-02-03

    Abstract: 本发明涉及图像处理技术领域,提出了基于任务型对话的图像编辑系统,包括对话理解模块,用于根据输入的对话文本得到对话状态,所述对话状态包括用户要编辑的属性和编辑程度;图像编辑模块,用于接收用户输入图像和对话状态,根据对话状态对用户输入图像进行编辑,输出编辑后的图像;系统回复模块,用于输出系统回复信息;所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数,所述编码器和所述解码器均为N个,每一所述解码器的输出均设置一个适应器。通过上述技术方案,解决了现有技术中图像编辑方法在连续的图像编辑时出现历史编辑信息遗忘、用户需求理解偏差、系统交互不准确、不灵活的问题。

    一种全局布局优化方法及装置
    14.
    发明公开

    公开(公告)号:CN118536447A

    公开(公告)日:2024-08-23

    申请号:CN202410811458.9

    申请日:2024-06-21

    Abstract: 本公开提供了一种全局布局优化方法及装置,属于深度学习技术领域,该方法包括:根据目标位置确定第一参数。目标位置为在FPGA中的布局位置。第一参数为全局布局质量评估指标。基于第一判断准则判断第一参数对应的目标位置是否需要调整。响应于第一参数对应的目标位置需要调整,基于第一算法更新目标超参数。目标超参数为用于确定目标位置的参数。基于目标超参数在FPGA中对目标位置的布局进行优化。本公开提供的一种全局布局优化方法及装置能够提高全局布局质量以及优化效率。

    虚假新闻检测方法及装置、电子设备、可读存储介质

    公开(公告)号:CN118445414A

    公开(公告)日:2024-08-06

    申请号:CN202410657457.3

    申请日:2024-05-25

    Abstract: 本公开提供了一种虚假新闻检测方法及装置、电子设备、可读存储介质,属于深度学习技术领域,该方法包括:根据目标新闻中的第一文本特征和第一图像特征确定对应于目标新闻的语义关联数据;语义关联数据包括第一数据和第二数据;第一数据和第二数据为不同种类的数据;对第一数据进行处理得到第三数据;第三数据包括虚假痕迹信息;基于第二数据和第三数据对目标大语言模型进行训练;基于已训练的目标大语言模型进行虚假新闻检测。本公开基于多模态的数据处理技术,能够更能准确地反映新闻内容的真实性和完整性。

    基于经验模态分解的图像超分辨系统

    公开(公告)号:CN114841861B

    公开(公告)日:2024-07-23

    申请号:CN202210565019.5

    申请日:2022-05-23

    Abstract: 本发明涉及图像处理技术领域,提出了基于经验模态分解的图像超分辨系统,输入模块,用于获得第一图像;所述第一图像为低分辨率图像;特征提取模块,用于所述提取第一图像的特征;IMF预测模块,用于根据所述第一图像的特征,预测得到多个IMF特征图;所述多个IMF特征图位于不同的频率;所述IMF预测模块包括多个平行的分支,每个分支为一个CNN滤波器组,且所述分支的数量与所述IMF特征图的数量相同;重建模块,用于根据设定的放大比例,将每一IMF特征图转换为新的IMF,得到多个新的IMF;将多个新的IMF进行叠加得到第二图像,所述第二图像为超分辨率图像。通过上述技术方案,解决了现有技术中图像分辨率低、导致虹膜识别精度低的问题。

    多智能体强化学习方法及装置、电子设备、存储介质

    公开(公告)号:CN118052272A

    公开(公告)日:2024-05-17

    申请号:CN202410189439.7

    申请日:2024-02-20

    Abstract: 本公开提供了一种多智能体强化学习方法及装置、电子设备、存储介质,属于超图表示学习技术领域,该方法包括:基于多智能体系统中各个智能体的观测信息生成多条超边。每条超边连接多个智能体,多条超边组成超图结构。超图结构为多智能体系统对应的通信结构。基于各个智能体的观测信息计算多智能体之间的消息权重。基于通信结构和消息权重生成多智能体系统对应的关联度。基于关联度对各个智能体的通信信息进行融合,得到每个智能体对应的融合通信信息。融合通信信息用于指导对应智能体的动作。本公开提供的多智能体强化学习方法及装置、电子设备、存储介质能对多个来自不同智能体的异构信息进行通信融合。

    一种对抗人脸隐私保护方法
    18.
    发明公开

    公开(公告)号:CN117912082A

    公开(公告)日:2024-04-19

    申请号:CN202410100065.7

    申请日:2024-01-24

    Abstract: 本公开提供了一种对抗人脸隐私保护方法,属于人脸识别技术领域,该方法包括:基于多个第一输入样本对对抗网络模型进行训练,以对对抗网络模型中的生成器参数和判别器参数进行第一阶段更新。第一输入样本为第一人脸图像。基于多个第二输入样本对对抗网络模型进行训练,以对对抗网络模型中的生成器参数和判别器参数进行第二阶段更新。第二输入样本为多个第二人脸图像。多个第二人脸图像对应的人员身份相同且面部变化不同。基于进行第二阶段更新后的生成器对人脸图像进行隐私保护。本公开提供的对抗人脸隐私保护方法能够提高人脸隐私保护的有效性和效率。

    图像生成方法及装置、电子设备、可读存储介质

    公开(公告)号:CN117788646A

    公开(公告)日:2024-03-29

    申请号:CN202410143913.2

    申请日:2024-02-01

    Abstract: 本公开提供了一种图像生成方法及装置、电子设备、可读存储介质,属于人工智能技术领域,该方法包括:将第一图像和对应于第一图像的第一文本提示输入至第一模型中得到第一反演噪声;将第一反演噪声以及多个第二文本提示输入至第二模型得到对应于多个第二文本提示的多个第二图像;将第三图像以及对应于第三图像的第三文本提示输入至噪声估计模型中以对噪声估计模型中的可学习参数进行更新;可学习参数更新后的噪声估计模型用于进行图像生成。本公开提供的图像生成方法及装置、电子设备、可读存储介质可以更加细粒度地提取参考图像的风格,使文本提示可以很好的表征风格,还可以生成组合风格的图像。

    基于遥感数据的旋转目标检测模型有效性评估方法

    公开(公告)号:CN117409183A

    公开(公告)日:2024-01-16

    申请号:CN202311491479.9

    申请日:2023-11-09

    Abstract: 本发明属于可信人工智能技术领域,具体公开了一种基于遥感数据的旋转目标检测模型有效性评估方法,解决了现有技术中的模型有效性评估方法存在的评估结果不全面且不精确的技术问题。本发明的评估方法包括利用遥感数据集训练旋转目标检测模型;确定多项评估指标,评估指标包括公平性指标、准确性指标、鲁棒性指标和隐私性指标中的至少一种以及可解释性指标;结合多项评估指标评估训练后的旋转目标检测模型的有效性。本发明结合公平性、准确性、鲁棒性和隐私性中的至少一种以及可解释性评估训练后的旋转目标检测模型的有效性,评估结果更为全面、准确。

Patent Agency Ranking