一种基于特征解耦增强的文本生成视频方法

    公开(公告)号:CN118658106A

    公开(公告)日:2024-09-17

    申请号:CN202411132278.4

    申请日:2024-08-19

    Abstract: 本发明公开一种基于特征解耦增强的文本生成视频方法,属于文本生成视频技术领域。其包括,将用户文本输入到预先训练好的文本生成视频网络模型中,得到与所述用户文本描述相符的视频;其中,所述文本生成视频网络模型包括视觉特征解耦网络、跨帧注意力模块及时间注意力模块,所述视觉特征解耦网络用于将视频特征进行解耦分层,所述跨帧注意力模块用于加强解耦分层的视频特征连续三帧的关联,所述时间注意力模块用于加强经过跨帧注意力输出的隐层特征全局帧的关联;本发明适用于文本生成视频,能够有效提升了生成视频细节质量。

    一种基于区域风格校正的人物属性编辑方法及装置

    公开(公告)号:CN118037897B

    公开(公告)日:2024-06-14

    申请号:CN202410438878.7

    申请日:2024-04-12

    Abstract: 本发明提供一种基于区域风格校正的人物属性编辑方法及装置。方法包括:对训练数据提取分割图,利用分割图对人物属性进行拆分,得到人物的不同属性,属性可以编辑;将拆分的人物属性和目标人姿态作为输入提取特征,利用区域特征匹配模块融合变换人物属性特征和目标人姿态特征,将细化后的特征解码得到目标人物粗图像;其次分别提取人物属性的风格编码,通过区域风格补偿模块将风格编码注入细化后的特征得到残差纹理图;然后利用残差纹理图对粗图像进行风格校正得到最终的人物图像;最后,利用区域风格一致性损失来监督风格校正的效果。由此将人物属性全局建模改为区域建模,不仅能对人物属性进行有效编辑,还保证了生成的目标图像具有真实纹理。

    一种基于区域风格校正的人物属性编辑方法及装置

    公开(公告)号:CN118037897A

    公开(公告)日:2024-05-14

    申请号:CN202410438878.7

    申请日:2024-04-12

    Abstract: 本发明提供一种基于区域风格校正的人物属性编辑方法及装置。方法包括:对训练数据提取分割图,利用分割图对人物属性进行拆分,得到人物的不同属性,属性可以编辑;将拆分的人物属性和目标人姿态作为输入提取特征,利用区域特征匹配模块融合变换人物属性特征和目标人姿态特征,将细化后的特征解码得到目标人物粗图像;其次分别提取人物属性的风格编码,通过区域风格补偿模块将风格编码注入细化后的特征得到残差纹理图;然后利用残差纹理图对粗图像进行风格校正得到最终的人物图像;最后,利用区域风格一致性损失来监督风格校正的效果。由此将人物属性全局建模改为区域建模,不仅能对人物属性进行有效编辑,还保证了生成的目标图像具有真实纹理。

    一种基于模块化网络建模视角间关系的多视角聚类方法

    公开(公告)号:CN117542057A

    公开(公告)日:2024-02-09

    申请号:CN202410029931.8

    申请日:2024-01-09

    Inventor: 刘如一 孙玉宝

    Abstract: 本发明公开了一种基于模块化网络建模视角间关系的多视角聚类方法,该方法包括以下步骤:通过提取数据不同视角的特征,构建多视角数据库;构建基于模块化的编码器‑解码器神经网络提取并训练得到多视角数据的统一表达;将统一表达进行转换并构造辅助优化目标函数;基于上述目标函数对模块化的编码器‑解码器中的编码器进行再优化获得优化的多视角数据统一表达;对多视角数据统一表达进行聚类得到多视角聚类结果。本发明利用模块化的编码器‑解码器神经网络进行多视角数据的统一表达获取,可以灵活且有效地建模多视角数据之间的关系,通过辅助优化目标函数进行编码器的优化,将进一步提升多视角聚类的性能。

    基于自注意力和深度卷积并行的高光谱重建方法

    公开(公告)号:CN116665063B

    公开(公告)日:2023-11-03

    申请号:CN202310926894.6

    申请日:2023-07-27

    Abstract: 本发明公开了基于自注意力和深度卷积并行的高光谱重建方法,属于计算机视觉图像处理技术领域。包括以下步骤:在编码阶段,利用CASSI光学系统进行压缩采样得到二维测量值,再经过反转色散过程,获得初始化信号;解码阶段,采用本方法提出的基于transformer和CNN并行架构的重建算法将2D压缩图像重建为3D高光谱图像,通过训练网络学习二维压缩测量数据到原始数据的逆变换,进一步使用训练好的模型重建压缩感知高光谱图像,实现了压缩感知高光谱图像的快速、精确重建,与传统迭代重建算法相比,在重建质量上有所提高,并且在重建高光谱数据上的计算时间上有显著提高,远快于传统算法。

    一种基于生成对抗网络的压缩感知图像重建方法及系统

    公开(公告)号:CN109544656B

    公开(公告)日:2023-05-23

    申请号:CN201811404831.X

    申请日:2018-11-23

    Abstract: 本发明公开了一种基于生成对抗网络的压缩感知图像重建方法,包括:S1、根据原始图像采样得到的测量向量与重建图像大小构建基于神经网络的生成对抗网络模型,并设计用于优化所述生成对抗网络模型参数的目标函数;S2、预设训练所述生成对抗网络模型时的参数;S3、根据所述目标函数,采用反向传播算法交替训练生成器与鉴别器;S4、若所述生成对抗网络模型收敛,则训练好的网络可以直接实现压缩感知任务,模型输出为由所述测量向量重构出的对应原图像;否则返回执行步骤S2‑S4。本发明利用生成器的强大映射能力,初步重建原始图像,利用生成器和鉴别器的对抗训练,使得生成器重建的图像像素分布更接近原始图像,达到了低采样率下精确重建原始图像的目的。

    一种基于平行多尺度融合网络的产品缺陷检测方法

    公开(公告)号:CN114841930A

    公开(公告)日:2022-08-02

    申请号:CN202210401478.X

    申请日:2022-04-18

    Abstract: 本发明公开了一种基于平行多尺度融合网络的产品缺陷检测方法,包括:将待检测的工业产品图像输入训练获得的产品缺陷检测网络模型,检测分割获得工业产品图像中的缺陷区域。训练获得产品缺陷检测网络模型,包括:构建产品缺陷检测网络模型;获取训练数据集,训练数据集包括历史工业产品图像和对应的缺陷区域的分割掩膜;将训练数据集送入产品缺陷检测模型中,构建历史工业产品图像和对应的缺陷区域的分割掩膜之间的映射关系;根据聚合损失函数,采用Adam优化器实现产品缺陷检测网络模型参数的迭代优化与更新。本发明实现了对工业产品图像分割缺陷区域,提高了分割的准确度。

    一种基于异质人脸图像融合特征的人脸识别方法

    公开(公告)号:CN110414378A

    公开(公告)日:2019-11-05

    申请号:CN201910619187.6

    申请日:2019-07-10

    Abstract: 本发明公开了一种基于异质人脸图像融合特征的人脸识别方法。对人脸数据库中的人脸图像进行预处理,裁剪出包含人脸的固定大小的图像;训练基于分离特征的人脸摆正模型,对经过预处理的人脸图像进行人脸的摆正;训练基于循环生成对抗网络的素描和漫画生成模型,对摆正后的人脸图像进行素描和漫画人脸图像的生成;利用残差网络对经过预处理和人脸摆正的真人图像和通过素描和漫画生成模型生成的素描和漫画人脸图像进行特征提取和融合,根据融合特征进行人脸识别。本发明的人脸识别准确率较高,有着较好的判别性和鲁棒性。

    一种新型图像处理设备用支撑装置

    公开(公告)号:CN109114377A

    公开(公告)日:2019-01-01

    申请号:CN201811159042.4

    申请日:2018-09-30

    Inventor: 周强 孙玉宝

    Abstract: 本发明公开了一种新型图像处理设备用支撑装置,包括底座和位于底座顶部呈三角型的支撑板,底座底部的边缘处等间距设置有四个液压缸,且液压缸活塞杆的顶部与底座的底端固定连接。本发明通过旋转两个立板上的手拧螺栓,使两个压块相对运动将图像处理设备夹紧,对图像处理设备进行进一步固定,避免在使用过程中图像处理设备掉落损毁,通过减速电动机输出轴的旋转,来带动第一齿轮旋转,与第一齿轮啮合的第二齿轮随之旋转,进而来带动旋转轴的旋转,固定板跟随旋转轴旋转,进而改变拍摄角度,方便使用,使用者使用该装置进行摄影时,可以坐在座椅上使用,提高了使用者的舒适度,有效的缓解使用者长时间使用产生的疲劳感。

    基于移动平台的人脸特征点定位跟踪方法

    公开(公告)号:CN103514441B

    公开(公告)日:2017-02-15

    申请号:CN201310429774.1

    申请日:2013-09-21

    Abstract: 本发明公开了一种改进的人脸特征点定位跟踪方法,力图在多个方面全面提升算法的性能,具体体现在特征选取,模型训练以及定位跟踪等方面做了较大改进,使算法运行效率大幅提升,并同时保证了定位跟踪的准确性,能够实现在移动平台上实时进行人脸特征点的检测定位。本发明分为训练和匹配两个阶段,训练阶段主要学习全局形状模型,角点形状模型,眼睛形状模型,嘴唇形状模型,角点局部纹理模型,特征点局部纹理模型。匹配过程采用分层的机制,形状投影采取加权投影的方式。本发明的效率大幅提升,每秒可以定位跟踪二十五帧以上,在移动平台上实现了实时定位跟踪。

Patent Agency Ranking