基于孪生网络融合LBP与注意力的多特征目标跟踪方法

    公开(公告)号:CN118628765A

    公开(公告)日:2024-09-10

    申请号:CN202410794241.1

    申请日:2024-06-19

    Abstract: 本发明公开了一种基于孪生网络融合LBP与注意力的多特征目标跟踪方法,该方法包括步骤:S1,提出了一种融合LBP特征的孪生网络;S2,在预处理后先对视频帧进行LBP特征提取,再将局部二值模式图送进孪生网络中进行训练,进而对目标进行浅深层特征提取;S3,在网络的每个特征层后引入协调注意力模块,将通道和空间坐标信息整合到生成的注意力图中;S4,将浅层网络提取出的信息与深层提取出的网络信息进行融合,再经过RPN进行训练;S5,利用SiamRPN两个分支进行相关运算,得到最终的分类分支和回归分支的输出,从而完成对目标物体的跟踪。本发明解决目前孪生网络在目标追踪上的缺陷,有效地缓解了位置信息丢失的问题,提高了孪生网络的追踪准确率和鲁棒性。

    一种基于融合特征降维的Fca-ProRes2Net说话人识别方法

    公开(公告)号:CN118588087A

    公开(公告)日:2024-09-03

    申请号:CN202410734797.1

    申请日:2024-06-07

    Inventor: 胡章芳 王燚 袁远

    Abstract: 本发明请求保护一种基于融合特征降维的Fca‑ProRes2Net说话人识别方法,包括步骤:S1,将语音信号进行预处理,得到适合提取说话人特征的语音信号,并将MFCC、GFCC以及它们的动态特征参数构成一种新的混合参数,该特征参数囊括了中高频以及动静态特征;S2,利用2DPCA对特征矩阵降维整合得到MMGFCC;S3,采用多尺度全连接的Res2Net网络来获取更大范围的感受野;S4,在主干网络ProRes2Net中加入频率域通道注意力网络:FcaNet,引入更多的频率分量信息;S5,运用Softmax函数对输出结果进行分类处理,之后使用交叉熵损失函数来寻求最优权重参数,最终得到优化的说话人识别模型。本发明可以有效地提取出表征能力强的特征参数并能高效地识别,提高了识别能力和泛化能力。

Patent Agency Ranking