一种自动对焦方法及装置
    11.
    发明公开

    公开(公告)号:CN110062150A

    公开(公告)日:2019-07-26

    申请号:CN201810055624.1

    申请日:2018-01-19

    Abstract: 本发明公开了一种自动对焦方法及装置,该方法包括:获取图像数据;对图像的对焦区域进行分块处理,提取各分块图像的图像锐度值;以各分块图像为单元,将每个分块内的每个像素点的值相加求均值,得到各分块图像的平均亮度值;根据各分块图像的平均亮度值计算各分块图像的权重;根据计算得到的各分块图像的图像锐度值和平均亮度值、权重值,得到帧内亮度归一化的图像锐度值;根据每帧图像得到的图像锐度信息得到帧间亮度归一化的图像锐度值,通过本发明,可减弱噪声和过曝区域对自动对焦效果的影响。

    运动矢量估计方法、系统及可读存储介质

    公开(公告)号:CN119854521A

    公开(公告)日:2025-04-18

    申请号:CN202411968852.X

    申请日:2024-12-30

    Abstract: 本发明涉及一种运动矢量估计方法、系统及可读存储介质,利用金字塔的多层结构,从不同层计算运动矢量,下采样的运动矢量计算采用稠密光流,并由最底层到最顶层利用卡尔曼滤波逐层更新不断迭代,上采样时依据上采样层的运动矢量更新结果所指向区域做局部的块匹配算法更新运动矢量,再通过最底层到最顶层过程中获得的滤波后的运动矢量进行纠正,由最顶层到最底层利用卡尔曼滤波逐层更新不断迭代,达到获得干净且准确的运动矢量的效果。由此结合了两种计算运动矢量的算法的优点并互相弥补其缺点,并通过金字塔的完整结构中由最底层到最顶层再到最底层的迭代,最终可以在处理信噪比很差的视频时,也能快速获得干净且判别较准确的运动矢量。

    目标跟踪系统及方法
    13.
    发明授权

    公开(公告)号:CN111833376B

    公开(公告)日:2024-07-05

    申请号:CN201910330691.4

    申请日:2019-04-23

    Abstract: 本发明提供了一种目标跟踪系统及方法,所述目标跟踪系统包括图像处理单元和目标跟踪单元,所述目标跟踪单元通过读取所述图像处理单元统计的每帧图像的亮度、色度和锐度,或统计的每帧图像的色度和亮度,以及计算得到的跟踪目标当前的运动信息来调整目标跟踪参数的更新速度,以及通过所述图像处理单元的统计信息来判断是否需要切换目标跟踪方法所用跟踪特征,若需要,则读取所述图像处理单元获取的图像的锐度信息以对跟踪特征进行切换,如此,便通过所述图像处理单元和所述目标跟踪单元的联用提升了目标跟踪的鲁棒性与准确度。

    神经网络定向拾音方法、系统及可读存储介质

    公开(公告)号:CN118155645A

    公开(公告)日:2024-06-07

    申请号:CN202410283399.2

    申请日:2024-03-13

    Abstract: 本发明涉及音频信号处理技术领域,尤其涉及一种神经网络定向拾音方法、系统及可读存储介质,方法包括以下步骤:将麦克风阵置于坐标系中,规定增强方向,麦克风阵列至少包括一个麦克风对;对每个麦克风对在增强方向上接收的目标声源信号进行增强处理,得到目标声源增强信号及目标声源阻塞信号;将目标声源增强信号及目标声源阻塞信号转换成特征向量;将特征向量输入训练好的深度神经网络模型中,输出的增益作用于目标声源信号,得到增强信号。相比于传统的定向增强算法,本发明在拾取增强方向中混杂着非增强方向的声音时,在资源消耗提升不大的情形下能够对增强方向的声音进行更好的保留同时对非增强方向的声音进行更好的抑制。

    一种人脸检测及特征预测跟踪显示的方法

    公开(公告)号:CN117115875A

    公开(公告)日:2023-11-24

    申请号:CN202211729484.4

    申请日:2022-12-30

    Abstract: 本发明提供了一种人脸检测及特征预测跟踪显示的方法,应用于计算机视觉技术领域,该方法包括:接收视频输入数据,并按帧分解视频输入数据,得到多帧输入图像;对多帧输入图像依次进行人脸检测,并对检测到的人脸进行对应位置记录;对多帧输入图像中检测到的人脸进行特征预测,并按照特征类别进行计算合并得到多个标签;将多个标签依次添加到各输入图像中记录的对应位置;将添加标签后的多个图像合成视频,并输出合成视频。本发明能够实现端到端提取多人同时出现的视频中的人脸,并实现高精度人脸特征预测,以及跟踪显示对应的特征,并能实时表示或导出为添加特征的视频。

    声源定位及语音增强方法、装置
    16.
    发明公开

    公开(公告)号:CN116863951A

    公开(公告)日:2023-10-10

    申请号:CN202311055231.8

    申请日:2023-08-21

    Abstract: 本发明公开了一种声源定位及语音增强方法、装置,属于音频信号处理技术领域,该声源定位方法,包括以下步骤:对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置。通过设置相应的增益因子和补偿因子作用在求和结果和差分结果上,从而分别解决低频指向性差和环境噪声的问题,且可以灵活选择麦克风对的组合,提升定位效果和语音增强效果。

    一种基于多麦克风的风噪抑制方法与装置

    公开(公告)号:CN114596874A

    公开(公告)日:2022-06-07

    申请号:CN202210203571.X

    申请日:2022-03-03

    Abstract: 本发明公开了一种基于多麦克风的风噪抑制方法及装置,所述方法包括如下步骤:步骤S1,根据各麦克风的低频能量大小选择输出麦克风信号;步骤S2,根据所述输出麦克风信号与其他麦克风信号每个频点的能量大小关系对所述输出麦克风信号的风噪频点进行抑制;步骤S3,将主麦克风与其他麦克风信号进行差分,取低频信号进行风噪检测与风噪大小估计,结合风噪连续性特点进行风噪抑制。

    一种模拟高清视频的数据传输方法及装置

    公开(公告)号:CN110858865A

    公开(公告)日:2020-03-03

    申请号:CN201810973367.X

    申请日:2018-08-24

    Abstract: 本发明公开了一种模拟高清视频的数据传输方法及装置,所述方法包括:步骤S1,接收待发送数据;步骤S2,对发送前的数据进行预处理,根据线缆的信道特性,于待发送数据中添加相应的训练数据及同步数据,并将经预处理后的数据存入帧消隐数据缓存和行消隐数据缓存;步骤S3,读取所述帧消隐数据缓存中的待发送数据进行二进制波形调制,并叠加到视频信号的相应的帧消隐行间隙上,读取所述行消隐数据缓存中的待发送数据进行二进制波形调制,并叠加到视频信号的相应的视频数据行消隐间隙上,从而完成结构化数据及数字音频数据与视频信号的共线传输,本发明可简单有效地解决模拟高清视频的较高速率的数据共线传输问题。

    一种语音信号处理方法及装置

    公开(公告)号:CN110197669B

    公开(公告)日:2021-09-10

    申请号:CN201810162252.2

    申请日:2018-02-27

    Abstract: 本发明公开一种语音信号处理方法及装置,所述方法包括如下步骤:步骤一,接收解码的远端信号,并于播放解码后的远端信号的同时采集近端信号;步骤二,估计并补偿延迟,对远端及近端信号进行数据对齐操作;步骤三,将对齐后的远端和近端信号送入带反馈的自适应回声抑制单元,抑制近端信号中的回声;步骤四,抑制近端信号中的残余回声与啸叫;步骤五,抑制近端信号中的噪声;步骤六,将近端信号通过网络传输出去,通过本发明,能够对全双工通话中的回声、残余回声、啸叫以及噪声进行抑制,能够以比较低的复杂度解决语音对讲中的回声、啸叫以及噪声等问题。

    一种卷积神经网络的压缩方法、装置及电子设备

    公开(公告)号:CN112308197A

    公开(公告)日:2021-02-02

    申请号:CN201910680935.1

    申请日:2019-07-26

    Abstract: 本发明实施例提供了一种卷积神经网络的压缩方法、装置及电子设备。针对每一卷积层,该方法包括:将该卷积层的权值张量变形为第一二维矩阵;确定第一二维矩阵的多个第一奇异值分解项;按照第一选取规则,从多个第一奇异值分解项中,选取至少一个第一奇异值分解项;利用各个第一奇异值分解项,对第一二维矩阵进行近似分解,得到第一分解矩阵和第二分解矩阵;将第一分解矩阵和第二分解矩阵分别变形为第一子权值张量和第二子权值张量,作为压缩后的权值张量;在得到目标卷积神经网络每一层卷积层压缩后的权值张量后,得到被压缩的目标卷积神经网络。与现有技术相比,应用本发明实施例提供的方案,可以降低关于压缩前后的卷积神经网络间的精准度差异。

Patent Agency Ranking