一种目标多模态并行识别方法、系统、存储介质及设备

    公开(公告)号:CN120030300A

    公开(公告)日:2025-05-23

    申请号:CN202510023880.2

    申请日:2025-01-07

    Abstract: 本发明实施例公开了一种目标多模态并行识别方法,所述方法包括:获取目标多模态信息,并将其转换为多模态特征图像;将所述多模态特征图像分区域加载至振幅型空间光调制器SLM,对光神经网络的输入光场进行振幅调制;对所述振幅调制完成后的输入光场进行相位调制;将经过相位调制后的光神经网络的输出光场转换成光强图像;判断所述光神经网络的层数是否符合衍射层数;若所述光神经网络的层数满足衍射层数要求,根据所述光强图像确定目标多模态并行识别结果。本发明通过将多模态信息转换为二维特征图像,并利用光神经网络进行处理,实现了多模态信息的并行识别,适用于需要快速、准确识别复杂目标的场景。

    无源集成光子器件的脉冲响应确定方法、系统及存储介质

    公开(公告)号:CN119966502A

    公开(公告)日:2025-05-09

    申请号:CN202510004760.8

    申请日:2025-01-02

    Abstract: 本发明实施例公开了一种无源集成光子器件的脉冲响应确定方法,所述方法包括:根据无源集成光子器件的S参数,得到带限基带S参数;基于所述带限基带S参数构建外推模型,确定所述外推模型的残差;利用所述残差和极点构建外推后的频谱;根据所述频谱得到更新后的S参数;确定所述带限基带S参数和更新后的S参数之间的参数误差;对所述参数误差进行补偿,并确定脉冲响应。本发明通过获取带限基带S参数并构建外推模型,对该带限基带S参数进行更新,根据更前后带限基带S参数的误差对其进行补偿,最终获取无源集成光子器件的脉冲响应,该脉冲响应可以真实地反映无源集成光子器件在实际工作条件下的性能。

    空间光调制衍射光神经网络在线学习装置及成像方法

    公开(公告)号:CN119918602A

    公开(公告)日:2025-05-02

    申请号:CN202411831617.8

    申请日:2024-12-12

    Abstract: 本发明公开了一种空间光调制衍射光神经网络在线学习装置及成像方法,该装置激光器提供单色光束,扩束透镜将其扩束;HWP改变偏振光的偏振方向,将入射振幅调制阵列上的光束偏振态调制成p偏光;高功率反射镜改变光传播方向并发射到衍射层;衍射层对光束振幅调控、相位调制后获得衍射光神经网络的最终输出;处理模块收集各CMOS获取到的衍射光神经网络各衍射层的输出光场图像以及当前的相位调制参数,根据设定损失函数确定梯度调整各衍射层的相位调制参数;控制模块将相位调制参数加载到对应衍射层的反射式相位型SLM上。该方案能够适应复杂多变的实际环境,有助于优化衍射光神经网络的性能和适应性,推动其在高性能计算和人工智能领域的广泛应用和发展。

    用于经纬图的编码块级拉格朗日乘子的优化方法

    公开(公告)号:CN108347611B

    公开(公告)日:2021-02-02

    申请号:CN201810174851.6

    申请日:2018-03-02

    Abstract: 本发明涉及视频编码的方法,特别是针对VR360视频经纬图格式下的编码技术领域,提供了一种用于经纬图的编码块级拉格朗日乘子的优化方法,其根据编码块在经纬图中的位置信息,计算该编码块所在球面环带的面积与其所在经纬图像素环带的面积之比ρ(θ),根据ρ(θ)对λsys进行优化计算得到优化后的拉格朗日乘子λ(ρ(θ)),并根据λ(ρ(θ))编码该编码块,通过面积比的形式将编码块的位置信息引入块级拉格朗日乘子的修正及优化,使得经纬图编码的整体性能得到了显著的提升,适用于VR360视频经纬图格式下的视频编码。

    用于经纬图的编码块级拉格朗日乘子的优化方法

    公开(公告)号:CN108347611A

    公开(公告)日:2018-07-31

    申请号:CN201810174851.6

    申请日:2018-03-02

    Abstract: 本发明涉及视频编码的方法,特别是针对VR360视频经纬图格式下的编码技术领域,提供了一种用于经纬图的编码块级拉格朗日乘子的优化方法,其根据编码块在经纬图中的位置信息,计算该编码块所在球面环带的面积与其所在经纬图像素环带的面积之比ρ(θ),根据ρ(θ)对λsys进行优化计算得到优化后的拉格朗日乘子λ(ρ(θ)),并根据λ(ρ(θ))编码该编码块,通过面积比的形式将编码块的位置信息引入块级拉格朗日乘子的修正及优化,使得经纬图编码的整体性能得到了显著的提升,适用于VR360视频经纬图格式下的视频编码。

    基于多元线性回归的视频编码帧间预测方法

    公开(公告)号:CN107483954A

    公开(公告)日:2017-12-15

    申请号:CN201710685286.5

    申请日:2017-08-11

    Abstract: 本发明的基于多元线性回归的视频编码帧间预测方法,包括:A.初始化信源t时刻的图像,将t-1时刻的图像为参考图像,在t-1时刻对t时刻的图像进行运动估计,得到绝对误差值;B.扩展t-1时刻的参考像素块大小,其中扩展的像素块信息分别为参考像素块的左边外侧像素与上边外侧像素,得到多元线性回归模型;C.在t时刻前对t时刻的图像进行重构,得到t时刻的重构图像中对应位置的像素值;D.确定是否更新参考图像:如果重构后的像素块与对应的信源像素块的绝对误差值小于步骤A的绝对误差值,则更新参考图像的像素;反之则不更新参考图像的像素。本发明有效增强了参考图像与当前编码图像的时域相关性,进而获得了更好的残差信息,非常明显的提高了编码效率。

    视频编码参考块滤波方法
    27.
    发明公开

    公开(公告)号:CN107295353A

    公开(公告)日:2017-10-24

    申请号:CN201710696789.2

    申请日:2017-08-15

    Abstract: 本发明涉及视频编码参考块滤波方法,包括:A.计算当前的参考像素块Bref的纹理复杂度C;B.参考像素块Bref DCT变换得到变换系数矩阵Iref,计算Bref的横向和纵向频率分布强度,以及对应的横向和纵向滤波因子;C.建立与参考像素块Bref相同大小的滤波模板U;D.将得到的变换系数矩阵Iref与滤波模版U的矩阵相乘得到滤波后的系数矩阵,进行IDCT变换得到滤波后的参考像素块;E.根据滤波后的参考像素块的平均绝对差和复杂度是否降低决定是否将滤波后的参考像素块回写至参考像素块Bref中。本发明能够有效的对图像纹理的进行平滑处理,明显的提高了图像编码的性能,同时也避免了对本身质量和参考性很好的像素块进行过滤,实现了自适应改善参考图像质量的目的。

    自适应的参考图像抉择方法

    公开(公告)号:CN107295334A

    公开(公告)日:2017-10-24

    申请号:CN201710696790.5

    申请日:2017-08-15

    Abstract: 本发明涉及自适应的参考图像抉择方法,包括:A.得到编码图像中第t帧的参考图像集合RSet(t);B.将时序为k的图像pick作为参考图像,计算第i帧在参考pick时消耗的比特数和pick参考价值;C.获得各个时序图像的参考价值,进而得到过去连续w个图像的参考价值集合;D.计算参考价值集合中所有w个参考价值的均值和方差,并通过均值方差的比值设置帧间最远参考距离L;E.根据所述均值和方差的大小对图像进行时域或质量的选择,并设置新参考图像集合 F.根据新参考图像集合 将每一帧编码的量化参数进行偏移设置。本发明能够根据不同的图像要求对图像的质量或时域相关性进行自适应选择,并且能够根据图像内容变化特征来制定参考图像管理规则显著提升视频序列编码性能。

    基于多元线性回归的视频编码帧间预测方法

    公开(公告)号:CN107483954B

    公开(公告)日:2019-12-03

    申请号:CN201710685286.5

    申请日:2017-08-11

    Abstract: 本发明的基于多元线性回归的视频编码帧间预测方法,包括:A.初始化信源t时刻的图像,将t‑1时刻的图像为参考图像,在t‑1时刻对t时刻的图像进行运动估计,得到绝对误差值;B.扩展t‑1时刻的参考像素块大小,其中扩展的像素块信息分别为参考像素块的左边外侧像素与上边外侧像素,得到多元线性回归模型;C.在t时刻前对t时刻的图像进行重构,得到t时刻的重构图像中对应位置的像素值;D.确定是否更新参考图像:如果重构后的像素块与对应的信源像素块的绝对误差值小于步骤A的绝对误差值,则更新参考图像的像素;反之则不更新参考图像的像素。本发明有效增强了参考图像与当前编码图像的时域相关性,进而获得了更好的残差信息,非常明显的提高了编码效率。

Patent Agency Ranking