一种基于金字塔注意力机制和对称网络的图像超分辨率方法

    公开(公告)号:CN114022362B

    公开(公告)日:2024-11-08

    申请号:CN202111364295.7

    申请日:2021-11-17

    摘要: 一种基于金字塔注意力机制和对称网络的图像超分辨率方法,首先对于待训练数据集处理,制作与真实图像对应的低分辨率图像;然后对真实图像输入进行特征提取,经过卷积‑池化操作后,通过金字塔注意力模块进行计算,获取图像的多层次信息分布与细节特征;再计算得到误差损失,用来更新网络参数与梯度;再进行重构得到重构的结果图,与真实图像进行计算损失,并反向更新网络的参数和梯度;最后将低分辨率图像输入进第二个网络,逐分辨率的扩大低分辨率图像,最后得到生成的高分辨率图像,并于真实图像计算损失,再次对网络的参数进行更新。本方法通过注意力机制和损失函数,对网络进行参数更新与迭代,极大提升网络的生成能力与泛化能力。

    基于噪声补偿的迭代平方根CKF的汽车雷达目标跟踪方法

    公开(公告)号:CN108304612B

    公开(公告)日:2021-08-10

    申请号:CN201711430008.1

    申请日:2017-12-26

    摘要: 本发明公开了一种基于噪声补偿的迭代平方根CKF的汽车雷达目标跟踪方法,本发明首先设置系统初始值,在时间更新阶段计算容积点值;传播容积点;估计一步预测状态和误差协方差平方根因子;在量测更新阶段引入Gauss‑Newton非线性迭代方法进行迭代更新,每次迭代时计算容积点;传播容积点;计算量测估计;计算新息协方差的平方根因子和互协方差矩阵;计算卡尔曼增益;更新本次迭代的状态和误差协方差平方根因子估计;判断是否达到迭代终止条件;更新此刻状态和误差协方差平方根的估计;量测更新过程中通过调整噪声补偿因子对状态估计进行优化。本发明能够有效提高汽车雷达目标跟踪过程中的精确性与稳定性。

    基于生成对抗网络和动态编辑模块的根据文本编辑图片的方法

    公开(公告)号:CN112818646A

    公开(公告)日:2021-05-18

    申请号:CN202110219192.5

    申请日:2021-02-26

    摘要: 本发明提出了一种基于生成对抗网络和动态编辑模块的根据文本编辑图片的方法,通过生成器和判别器的对抗训练,使得生成器最终能够将给定的图片编辑为与文本描述相匹配的图片。主要包括以下步骤:获取文本与图片匹配的数据集、搭建基于生成对抗网络的生成对抗模型;通过梯度下降法迭代训练生成网络和判别网络。最终获得一个能够有效根据文本编辑已有图片的生成器。本发明通过生成器中的动态编辑模块以及动态卷积模块,将文本信息融合进图片解码过程中;通过对判别器的零中心匹配梯度惩罚,促使生成器生成的图片与给定的文本匹配;有效地解决了编辑的图片细节缺失,编辑后的图片与给定文本不匹配的问题。

    基于生成对抗网络和动态编辑模块的根据文本编辑图片的方法

    公开(公告)号:CN112818646B

    公开(公告)日:2023-07-14

    申请号:CN202110219192.5

    申请日:2021-02-26

    摘要: 本发明提出了一种基于生成对抗网络和动态编辑模块的根据文本编辑图片的方法,通过生成器和判别器的对抗训练,使得生成器最终能够将给定的图片编辑为与文本描述相匹配的图片。主要包括以下步骤:获取文本与图片匹配的数据集、搭建基于生成对抗网络的生成对抗模型;通过梯度下降法迭代训练生成网络和判别网络。最终获得一个能够有效根据文本编辑已有图片的生成器。本发明通过生成器中的动态编辑模块以及动态卷积模块,将文本信息融合进图片解码过程中;通过对判别器的零中心匹配梯度惩罚,促使生成器生成的图片与给定的文本匹配;有效地解决了编辑的图片细节缺失,编辑后的图片与给定文本不匹配的问题。

    基于最近邻与困难样本挖掘的无监督图像嵌入学习方法

    公开(公告)号:CN114579783A

    公开(公告)日:2022-06-03

    申请号:CN202210232828.4

    申请日:2022-03-09

    摘要: 本发明是一种基于最近邻与困难样本挖掘的无监督图像嵌入学习方法,包括步骤1:搭建深度学习框架运行环境;步骤2:搭建执行无监督嵌入学习任务的网络模型;步骤3:使用数据集通过端到端的方式对网络进行训练;步骤4:将步骤3完成训练后的图像输入到无监督嵌入学习任务的网络模型中,根据图像特征之间的余弦相似性检索出相似度最近的图像,如检索到的图像属于同一类别,则检索成功。该方法利用深度神经网络对图像提取特征,然后根据特征之间的余弦相似性,挖掘样本的最近邻域,从而将图像分为若干个邻域,邻域内的样本图像共享伪类别信息,使得模型能够学习到图像的高判别性特征。

    一种基于金字塔注意力机制和对称网络的图像超分辨率方法

    公开(公告)号:CN114022362A

    公开(公告)日:2022-02-08

    申请号:CN202111364295.7

    申请日:2021-11-17

    IPC分类号: G06T3/40 G06N3/04 G06N3/08

    摘要: 一种基于金字塔注意力机制和对称网络的图像超分辨率方法,首先对于待训练数据集处理,制作与真实图像对应的低分辨率图像;然后对真实图像输入进行特征提取,经过卷积‑池化操作后,通过金字塔注意力模块进行计算,获取图像的多层次信息分布与细节特征;再计算得到误差损失,用来更新网络参数与梯度;再进行重构得到重构的结果图,与真实图像进行计算损失,并反向更新网络的参数和梯度;最后将低分辨率图像输入进第二个网络,逐分辨率的扩大低分辨率图像,最后得到生成的高分辨率图像,并于真实图像计算损失,再次对网络的参数进行更新。本方法通过注意力机制和损失函数,对网络进行参数更新与迭代,极大提升网络的生成能力与泛化能力。

    基于非对称卷积网络和注意力机制的跨视角图像生成方法

    公开(公告)号:CN112884893A

    公开(公告)日:2021-06-01

    申请号:CN202110275614.0

    申请日:2021-03-15

    摘要: 本发明公开了一种基于非对称卷积网络和注意力机制的跨视角图像生成方法,该网络结构由两个部分组成:一阶段生成网络和二阶段生成网络。首先,将原始输入送到一阶段生成网络中生成粗略的结果,然后将一阶段网络生成的粗略结果作为输入送到二阶段生成网络中生成精细的结果,将其作为最终的结果输出。本方法在U‑net网络中嵌入非对称卷积来提高网络在不同尺度上提取对象特征的能力,并且使用空间自适应归一化代替传统的批归一化。此外,为了更好地学习来自不同视图的图像之间的对应关系,本方法使用SE模块来细化中间特征图,从而生成更真实的图像。最后,本方法还设计了一个额外的损失函数来增强网络的学习能力,从而实现更稳定的优化过程。

    基于噪声补偿的迭代平方根CKF的汽车雷达目标跟踪方法

    公开(公告)号:CN108304612A

    公开(公告)日:2018-07-20

    申请号:CN201711430008.1

    申请日:2017-12-26

    IPC分类号: G06F17/50 G01S13/72

    摘要: 本发明公开了一种基于噪声补偿的迭代平方根CKF的汽车雷达目标跟踪方法,本发明首先设置系统初始值,在时间更新阶段计算容积点值;传播容积点;估计一步预测状态和误差协方差平方根因子;在量测更新阶段引入Gauss-Newton非线性迭代方法进行迭代更新,每次迭代时计算容积点;传播容积点;计算量测估计;计算新息协方差的平方根因子和互协方差矩阵;计算卡尔曼增益;更新本次迭代的状态和误差协方差平方根因子估计;判断是否达到迭代终止条件;更新此刻状态和误差协方差平方根的估计;量测更新过程中通过调整噪声补偿因子对状态估计进行优化。本发明能够有效提高汽车雷达目标跟踪过程中的精确性与稳定性。

    基于音频信号的轻量化多特征提取情感识别系统及方法

    公开(公告)号:CN118486332A

    公开(公告)日:2024-08-13

    申请号:CN202410085402.X

    申请日:2024-01-19

    发明人: 董志伟 王彩玲

    摘要: 本发明提出了一种基于音频信号的轻量化多特征提取情感识别系统及方法,该系统包括:预处理模块,用于对原始的音频信号进行预处理,输出原始信号的频域信息;梅尔滤波器组处理模块,用于将原始信号的频域信息转换为梅尔时频谱图;多特征提取模块,用于提取梅尔时频谱图中的特征;金字塔Transformer,用于接收多特征提取模块输出的多特征并输出高维编码特征;及全连接层,用于对金字塔Transformer输出的高维编码特征进行最终分类。本发明可充分提取信号频谱图的特征信息,从而提升信号分类识别精度。