基于并行视觉自注意力模型的轻量级高动态范围图像合成方法

    公开(公告)号:CN118674635A

    公开(公告)日:2024-09-20

    申请号:CN202410579346.5

    申请日:2024-05-10

    Abstract: 本发明提出了轻量级的基于并行视觉自注意力模型(Parallel Vision Transformer)的多曝光低动态范围(LDR)图像合成高质量的无鬼影高动态范围(HDR)图像的方法,包括以下步骤:1)首先使用卷积层和空间注意力模块从输入的三张不同曝光值的LDR图像中提取低层特征。2)然后将低层特征分割成不重叠的图像块。3)接着送入并行视觉自注意力模块,有效地捕捉图像中的特征和信息。4)最后通过卷积层和激活函数合成最终的HDR图像。本发明以模型的并行架构使网络变得更宽且更深,通过更快的速度和更少的计算资源把三张不同曝光的LDR图像合成高质量的无鬼影HDR图像,这使得该方法非常适合部署在各种边缘设备上。

    基于多视角特征融合的行人重识别方法

    公开(公告)号:CN113688856A

    公开(公告)日:2021-11-23

    申请号:CN202110314091.6

    申请日:2021-03-24

    Abstract: 本发明涉及基于多图像特征融合的行人重识别方法,属于计算机视觉的图像检索领域。第一步,利用深度卷积网络对测试集行人图像进行原始的特征提取;第二步,计算特征间的相似度,利用k互近邻构造图;第三步,沿着图进行信息传递,将聚合的特征与原始特征相结合;第四步,计算检测图像与待检测集的相似度,排序得到重识别结果。本发明设计合理,考虑到了不同图像间的信息交互,提高了特征的鲁棒性,从而提高了识别的准确率。

    基于泰勒解耦和记忆单元校正的视频预测方法

    公开(公告)号:CN113132737A

    公开(公告)日:2021-07-16

    申请号:CN202110431011.5

    申请日:2021-04-21

    Abstract: 本发明涉及基于泰勒解耦和记忆单元校正的视频预测方法,属于计算机视觉视频技术领域。针对具有时序相干性的自监督视频预测任务,本发明利用分而治之的思想,将视频帧在高维空间上分解为泰勒分量和残差分量,然后再分别对这两部分进行时序上的推导,最后通过融合这两部分的时序推导信息来预测未来的视频帧。其中泰勒分量只利用第一帧的信息进行时序推导,用来挖掘出复杂的视频序列动态数据中存在的物理规律,并用融合了所有之前的帧信息的记忆单元对时序推导的泰勒分量进行校正,用来模拟视频序列中的额外的变量。残差分量的时序推导用简单的3层ConvLSTM实现。实验结果表明,本发明可以有效的进行长距离的视频预测,并在不同的数据集上也有不错的泛化能力。

    基于参考亮度指标指导的低照度可调节亮度增强方法

    公开(公告)号:CN112465726A

    公开(公告)日:2021-03-09

    申请号:CN202011437884.9

    申请日:2020-12-07

    Abstract: 本发明涉及一种基于参考亮度指标指导的低照度可调节亮度增强方法,属于计算机视觉图像技术领域。第一步,通过卷积、下采样和全局平均池化等方式,对输入暗光图像和参考亮度指标进行特征提取,得到特征向量;第二步,将特征向量分解为亮度和内容特征分量,组合暗光图像的内容分量和参考亮度指标的亮度分量,实现特征重组;第三步,通过转置卷积、上采样和跳连等方式,对重组的特征向量进行重建。本发明设计合理,充分考虑了不同应用场景或用户对光照的不同需求,高效地利用并保留了图像的亮度和内容信息,另外网络复杂度较低,在取得较好亮度增强效果的同时,保持了较快的运行速度,整体在暗光图像可调节亮度增强上取得了较好的效果。

    一种基于异构分离卷积核的模型压缩与加速方法

    公开(公告)号:CN111612145A

    公开(公告)日:2020-09-01

    申请号:CN202010442785.3

    申请日:2020-05-22

    Abstract: 本发明针对卷积特征图存在大量的相似性这一现象,提出了SPConv,一种基于异构分离卷积核的模型压缩与加速方法。SPConv将输入特征图分为“有代表性的通道”和“冗余的通道”两部分,并利用计算量较大但是特征提取能力强的卷积核来提取“有代表性的通道”中存有的重要本质信息;而利用计算开销非常小的卷积核来提取“冗余通道”中隐藏的微小细节信息。然后二者再通过本发明设计的“无参数量的特征融合方法”进行特征融合。本发明设计的SPConv是一个即插即用的卷积模块,可以在当前网络架构中直接进行替代。在图片分类和目标检测数据数据集上的实验表明本发明保证了在参数量和浮点数计算量大幅下降的情况下,其模型性能和在GPU上的推理速度均超过了基准方法。

    基于注意力机制和多层次特征融合的低照度图像增强方法

    公开(公告)号:CN110210608A

    公开(公告)日:2019-09-06

    申请号:CN201910483957.9

    申请日:2019-06-05

    Abstract: 本发明涉及一种基于注意力机制和多层次特征融合的低照度图像增强方法,包括以下步骤:在输入端对低照度图像进行处理,输出四通道特征图;使用基于注意力机制的卷积层作为特征提取模块,用于提取基础特征作为低层特征;将低层特征与相应的高层特征和卷积层最深层次的特征融合,经过反卷积层后,获得最终特征图;输出映射将最终的特征图还原成RGB图片。本发明充分利用了深度卷积神经网络模型的多层次特征,将不同层次特征融合,并通过通道注意力机制,给予特征通道不同的权重,获得了更优的特征表示,提高了图像处理的准确率,获取了高质量图像,可广泛用于计算机低层次视觉任务技术领域。

    一种基于堆结构扩张软件定义网络的方法

    公开(公告)号:CN106713136A

    公开(公告)日:2017-05-24

    申请号:CN201611056675.3

    申请日:2016-11-25

    Abstract: 本发明提供一种基于堆结构扩张软件定义网络的方法,所述方法包括:步骤1,将网络系统中的数据层抽象为多层次的斐波那契堆结构;步骤2,在所述得到的多层次斐波那契堆中依照自上而下顺序,利用双权重扩展Dijkstra路由算法解析得到最短路由路径。本申请有效的化简了软件定义网络的扩展过程,并结合堆结构改良了网络中的最短路由算法,同时有效的降低了各节点运算设备的负担。

    一种智能手机室内定位方法

    公开(公告)号:CN104215238A

    公开(公告)日:2014-12-17

    申请号:CN201410415407.0

    申请日:2014-08-21

    CPC classification number: G01C21/18

    Abstract: 本发明涉及一种智能手机室内定位方法,其技术特点是:步骤1、在行人行进过程中,利用智能手机内置的加速度传感器和陀螺仪进行行人航位推算,包括判断行人运动状态、计算发生的步伐数、计算行进距离并推算行人方向变化,得到推算的位置信息;步骤2、建立室内环境磁场地图,利用室内环境磁场地图和磁场传感器实时获得的信息,通过粒子滤波算法进行磁场匹配,进而对推算的位置信息进行校正,得到行人的最终位置。本发明从抵御多种手持手机的方法和不同步伐长度处理两方面来提升室内定位的鲁棒性;从提高磁场匹配判决权重的稳定性和降低系统累计误差两方面来提高匹配精度,避免长时间累积误差的出现;从减少外部设备数量上来降低系统复杂度。

    基于图像修复和矢量预测算子的帧内预测视频编码方法

    公开(公告)号:CN102595140B

    公开(公告)日:2014-05-28

    申请号:CN201210060588.0

    申请日:2012-03-09

    Abstract: 本发明涉及一种基于图像修复和矢量预测算子的帧内预测视频编码方法,其技术特点是:(1)计算当前块基于HEVC中传统帧内预测模式的率失真代价值RD1;(2)计算当前块基于拉普拉斯方程图像修复方法的帧内预测模式的率失真代价值RD2,若RD2小于RD1,则计算当前块基于全变分模型图像修复方法的帧内预测模式的率失真代价值RD2;(3)计算当前块基于矢量预测算子的帧内预测模式的率失真代价值RD3;(4)编码端根据RD1、RD2和RD3的比较结果,计算得到当前块的预测像素值并对当前块进行预测、压缩和编码。本发明设计合理,提高了已有的基于图像修复的帧内预测模式的预测准确性,能够在编解码后视频质量基本不变的情况下,降低编码码率,从而提高视频编码的压缩效率。

Patent Agency Ranking