基于多尺度卷积神经网络和自注意力网络的凝视估计方法、装置、设备及存储介质

    公开(公告)号:CN119625810A

    公开(公告)日:2025-03-14

    申请号:CN202510030272.4

    申请日:2025-01-08

    Abstract: 本申请公开了一种基于多尺度卷积神经网络和自注意力网络的凝视估计方法、装置、设备及存储介质,本申请涉及图像数据处理技术领域,该方法包括:通过预设多尺度卷积网络对目标面部图像进行并行特征提取,获得初始面部特征;对初始面部特征进行特征交叉融合,获得多尺度融合特征;通过自注意力网络对多尺度融合特征进行特征增强,获得目标特征图;基于目标特征图进行凝视方向预测,获得目标凝视结果。本申请通过并行提取目标面部图像的包含不同尺寸特征,然后对初始面部特征进行特征交叉融合,通过不同感受野有效融合不同尺度特征;最后通过自注意力网络加强多尺度融合特征的全局信息,基于精确获取的目标特征图提高最终的目标凝视结果精度。

    一种关键帧提取方法、装置及存储介质

    公开(公告)号:CN118840699A

    公开(公告)日:2024-10-25

    申请号:CN202411314338.4

    申请日:2024-09-20

    Abstract: 本发明公开了一种关键帧提取方法、装置及存储介质,方法包括:获取待处理视频的帧图像;对获取到的帧图像逐帧进行局部特征提取和深度特征提取,得到每一帧图像的局部特征和深度特征;计算每一帧图像与相邻帧图像的局部特征余弦相似度和深度特征余弦相似度,将计算得到的局部特征余弦相似度和深度特征余弦相似度加权融合,得到每一帧图像与其相邻帧图像的总相似度;响应于某一帧图像与其相邻帧图像的总相似度为由待处理视频中所有帧图像与其相邻帧图像的总相似度构成的序列的局部极小值、且总相似度小于预设的自适应阈值,提取这一帧作为待处理视频的关键帧。本发明能够提高关键帧提取的准确性和鲁棒性。

    基于非线性频偏的频率分集阵多目标跟踪与定位方法

    公开(公告)号:CN115792798A

    公开(公告)日:2023-03-14

    申请号:CN202211521276.5

    申请日:2022-11-30

    Inventor: 李昌利 刘德生

    Abstract: 本发明涉及基于非线性频偏的频率分集阵多目标跟踪与定位方法,基于各阵元直线等间距阵列排布的阵元阵列,针对各阵元分别执行发射与接收操作下的RGB格式波束图P,根据阵元阵列中第2个阵元至最后1个阵元分别相对第1个阵元的发射频率偏移,经各阵元分别执行发射与接收操作下、针对目标对象位置的发射导向矢量的确定,分析RGB格式波束图P对应的波束能量,进而针对RGB格式波束图P依次通过灰度化、二值化、以及聚类分析设计,由各个聚类中心位置构成各个目标对象的方位,如此通过对波束图的处理,实现多个目标的高精度探测与定位。

    一种水下图像复原及其对比度和边缘增强方法

    公开(公告)号:CN115131248A

    公开(公告)日:2022-09-30

    申请号:CN202210871256.4

    申请日:2022-07-23

    Abstract: 本发明公开了一种水下图像复原及其对比度和边缘增强方法,首先,依据红绿通道、红蓝通道像素比精细化地筛选出背景光点,得到更好的复原水下图像。接着,通过设计算法计算对比度权重图,再结合白平衡的思想自适应性地提高复原水下图像的对比度。最后,先提取图像高频信息,然后通过锐化的手段实现了图像的边缘细节增强,本发明水下图像复原及其对比度和边缘增强方法,该方法处理后的图像具有较好的视觉效果和对比度。

    基于局部Otsu阈值化的边缘检测方法

    公开(公告)号:CN114943744A

    公开(公告)日:2022-08-26

    申请号:CN202210457562.3

    申请日:2022-04-27

    Abstract: 本发明公开了基于局部Otsu阈值化的边缘检测方法,首先对原始图像进行均匀分区,得到面积大小相同的四块区域;然后采用Otsu算法计算每一块区域的阈值,得到四个阈值;接着利用每个阈值对各自的区域进行阈值化处理,得到二值图像;最后使用边缘检测算子对二值图像进行边缘检测,得到边缘图像。通过本发明方法使得边缘检测质量得到提高,可以有效的滤除噪声,保留关键的边缘,并且能得到连续性良好的单像素闭合边缘线,为之后的特征物提取、目标识别等提供了良好的基础。

    基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质

    公开(公告)号:CN119693222B

    公开(公告)日:2025-05-13

    申请号:CN202510208123.2

    申请日:2025-02-25

    Abstract: 本申请公开了一种基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质,本申请涉及三维重建技术领域,该方法包括:对目标房屋的室内多视角全景图进行二维布局预测,获得二维布局视图;基于二维布局视图进行预设光线投射,获得初始平面图;对初始平面图进行预设多标签图割正则化,获得正则化平面图;对正则化平面图进行全景几何转换,获得目标房屋对应的目标布局视图。本申请首先获取房屋室内全景图对应的初始的二维布局视图,然后对其进行光线投射获得初始平面图,再对初始平面图进行正则化,并使用多标签图割获得准确完整的正则化平面图。再将正则化平面图转换获得目标房屋对应真实可靠的具有全景几何关系的目标布局视图。

    基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质

    公开(公告)号:CN119693222A

    公开(公告)日:2025-03-25

    申请号:CN202510208123.2

    申请日:2025-02-25

    Abstract: 本申请公开了一种基于多视图全景与多标签图割的房屋空间布局估计方法、装置、设备及存储介质,本申请涉及三维重建技术领域,该方法包括:对目标房屋的室内多视角全景图进行二维布局预测,获得二维布局视图;基于二维布局视图进行预设光线投射,获得初始平面图;对初始平面图进行预设多标签图割正则化,获得正则化平面图;对正则化平面图进行全景几何转换,获得目标房屋对应的目标布局视图。本申请首先获取房屋室内全景图对应的初始的二维布局视图,然后对其进行光线投射获得初始平面图,再对初始平面图进行正则化,并使用多标签图割获得准确完整的正则化平面图。再将正则化平面图转换获得目标房屋对应真实可靠的具有全景几何关系的目标布局视图。

    一种关键帧提取方法、装置及存储介质

    公开(公告)号:CN118840699B

    公开(公告)日:2025-02-14

    申请号:CN202411314338.4

    申请日:2024-09-20

    Abstract: 本发明公开了一种关键帧提取方法、装置及存储介质,方法包括:获取待处理视频的帧图像;对获取到的帧图像逐帧进行局部特征提取和深度特征提取,得到每一帧图像的局部特征和深度特征;计算每一帧图像与相邻帧图像的局部特征余弦相似度和深度特征余弦相似度,将计算得到的局部特征余弦相似度和深度特征余弦相似度加权融合,得到每一帧图像与其相邻帧图像的总相似度;响应于某一帧图像与其相邻帧图像的总相似度为由待处理视频中所有帧图像与其相邻帧图像的总相似度构成的序列的局部极小值、且总相似度小于预设的自适应阈值,提取这一帧作为待处理视频的关键帧。本发明能够提高关键帧提取的准确性和鲁棒性。

    一种背景光估计方法、水下图像复原方法及电子设备

    公开(公告)号:CN116797477A

    公开(公告)日:2023-09-22

    申请号:CN202310709155.1

    申请日:2023-06-15

    Inventor: 李昌利

    Abstract: 本发明公开了一种图像处理技术领域的背景光估计方法、水下图像复原方法及电子设备,旨在解决现有技术中对RGB三个通道的背景光进行统一估计导致的准确性差问题。本发明通过原始输入图像三个颜色通道总像素值大小确三个颜色通道衰减速度,并根据邻域像素的像素值对三个颜色通道的像素进行筛选,通过不同的方法分别计算三个颜色通道的背景光估值,进而对三个通道分别进行复原。本发明可用于水下图像处理,能够实现RGB三个通道背景光的一一准确估计,提高水下图像复原质量。

    一种昆虫投放用无人机
    10.
    发明授权

    公开(公告)号:CN114590405B

    公开(公告)日:2023-08-01

    申请号:CN202210288600.7

    申请日:2022-03-22

    Abstract: 本发明公开了一种昆虫投放用无人机,包括无人机和搭载在无人机上的投放装置,投放装置包括昆虫储存盒和执行机构,通过昆虫储存盒储存合适的昆虫,并搭载在无人机上,运输到指定区域后,利用执行机构将昆虫储存盒打开,从而释放其内部的昆虫,进行“以虫治虫”工作,其中,通过在昆虫储存盒内设有网布,以便于昆虫进行依附,并通过网布的布设方式和弹力绳的作用,在昆虫储存盒完全打开时,给予网布朝向昆虫储存盒开口方向的作用力,可将网布上未脱离的昆虫向外弹出,确保昆虫全部脱离网布进入指定区域,提高投放效率。

Patent Agency Ranking