基于尺度解耦的统一室内室外单目深度估计方法、电子设备以及存储介质

    公开(公告)号:CN118447066A

    公开(公告)日:2024-08-06

    申请号:CN202410538108.X

    申请日:2024-04-30

    Abstract: 本发明提供了一种基于尺度解耦的统一室内室外单目深度估计方法、电子设备以及存储介质。该方法包括:利用特征交互器将多个深度划分查询与目标图像的多尺度融合特征进行交互;利用自适应相对深度估计模块对更新后的深度划分查询进行处理;基于深度划分的归一化处理结果得到深度区间的中心值,与深度特征表示进行相似性计算,得到深度区间的概率;将深度区间的概率与深度区间的中心值进行处理,得到目标图像的相对深度估计结果;通过特征交互器实现尺度查询与多尺度融合特征之间的交互;利用语义感知尺度预测模块将语义感知的尺度查询投影为尺度因子,将尺度因子和相对深度估计结果进行运算,得到目标图像的绝对深度估计结果。

    目标检测模型的训练方法、目标检测方法及电子设备

    公开(公告)号:CN117576520B

    公开(公告)日:2024-05-17

    申请号:CN202410059185.7

    申请日:2024-01-16

    Abstract: 本发明提供了一种目标检测模型的训练方法、目标检测方法及电子设备。该方法包括:将第一模态样本输入目标检测模型的第一神经网络,得到第一模态样本特征向量;将第二模态样本输入目标检测模型的第二神经网络,得到第二模态样本特征向量;对第一模态样本特征向量与第二模态样本特征向量进行第一拼接处理,得到第三模态样本特征向量;将第三模态样本特征向量输入目标检测模型的第三神经网络,得到第四模态样本特征向量;将第四模态样本特征向量输入目标检测模型的第四神经网络,得到目标样本对象的检测结果;利用目标样本对象的检测结果调整目标检测模型的模型参数,得到经训练的目标检测模型。

    一种基于场景提示的单目标跟踪方法

    公开(公告)号:CN116168216B

    公开(公告)日:2023-07-18

    申请号:CN202310430642.4

    申请日:2023-04-21

    Abstract: 本公开提供一种基于场景提示的单目标跟踪方法,对视频图像中的目标进行动态跟踪,包括:确定包含目标的目标模板图像和搜索区域图像并分块;将分块后的目标模板图像和搜索区域图像通过线性映射得到对应的目标模板图像特征和搜索区域图像特征;将目标模板图像特征和搜索区域图像特征输入场景提示的视觉Transformer中,并在动态获取的场景提示符的作用下进行特征交互与增强;利用经过场景提示的视觉Transformer增强后的搜索区域特征回归目标框,并估计目标框的质量;以及跟踪器将目标框质量好的跟踪帧的特征保存在内存中,当到达给定的提示符更新间隔时,场景提示生成器利用内存中保存的特征生成新的场景提示符。

    基于动态原型学习的小样本视频目标分割方法

    公开(公告)号:CN114638839B

    公开(公告)日:2022-09-30

    申请号:CN202210536170.6

    申请日:2022-05-18

    Abstract: 本发明公开了一种基于动态原型学习的小样本视频目标分割方法,包括:获取待分割的视频目标;利用基于动态原型学习的小样本视频目标分割模型处理待分割的视频目标,获得视频目标分割结果。本发明提供的小样本视频目标分割方法,使用最优传输方法自适应学习动态原型,有效减少了噪声注意力,同时采用引导的方式对多层级特征图进行匹配,大幅减少了计算量;该方法可以充分提取少量支撑集样本中的目标信息,显著提高在质询集视频上的分割性能。本发明同时还公开了用于执行基于动态原型学习的小样本视频目标分割方法的电子设备、存储介质以及计算机程序产品。

    目标定位模型训练方法、目标定位方法及装置

    公开(公告)号:CN114462559B

    公开(公告)日:2022-07-15

    申请号:CN202210387877.5

    申请日:2022-04-14

    Abstract: 本发明提供了一种目标定位模型训练方法、目标定位方法及装置,可以应用于人工智能技术领域。该目标定位模型训练方法包括:获取样本数据集;将每个图像样本输入初始模型的像素特征提取层,输出图像数据中每一个像素点的像素特征;将第一特征数据和第二特征数据输入初始模型的激活图生成层,输出前景激活图和背景激活图;将第三特征数据和第四特征数据分别输入初始模型的感知特征提取层,输出前景感知特征和背景感知特征;将第五特征数据和第六特征数据分别输入初始模型的分类层,输出分类结果;以及根据分类结果和图像类别标签调整初始模型的模型参数,得到训练完成的目标定位模型。

    基于病灶感知建模的糖尿病视网膜病变自动评估系统

    公开(公告)号:CN112967227A

    公开(公告)日:2021-06-15

    申请号:CN202110134108.X

    申请日:2021-01-29

    Abstract: 本发明提供了一种基于病灶感知建模的糖尿病视网膜病变自动评估系统,包括:编码模块,用于对输入的图像进行特征提取,经过预处理,最终输出经过前馈网络得到的增强特征图;解编码模块,用于学习病灶滤波器,进而自动识别多样性的病灶区域;分级模块,用于实现糖尿病视网膜病变分级及病灶定位,所述分级模块包括分类模块,所述分类模块用于预测病变严重等级。本发明所提供的自动评估系统能通过端到端的方式训练网络,通过学得的病灶滤波器自动识别多样性的病灶区域,从而同时进行DR的严重性分级和病灶定位。

    三维目标检测模型的训练方法、三维目标检测方法及装置

    公开(公告)号:CN119672698A

    公开(公告)日:2025-03-21

    申请号:CN202411601500.0

    申请日:2024-11-11

    Abstract: 本申请提供了一种三维目标检测模型的训练方法、三维目标检测方法及装置,该训练方法包括获取训练数据集合;基于预设三维体素化规则,对点云训练数据进行体素化处理,得到多个网格点云特征;利用第一初始编码网络处理多个网格点云特征,得到目标点云特征,其中,第一初始编码网络是基于序列化模块和目标线性复杂度模型构建的;利用第二初始编码网络对目标点云特征进行目标检测处理,得到目标预测结果;对目标预测结果和与点云训练数据对应的目标边界框属性信息进行匹配处理,得到目标匹配结果;将目标匹配结果输入目标损失函数,得到目标损失值,以根据目标损失值迭代地调整初始检测模型的网络参数,从而得到三维目标检测模型。

    跨模态图文匹配的方法、装置及计算机可读存储介质

    公开(公告)号:CN112905827B

    公开(公告)日:2024-02-27

    申请号:CN202110183075.8

    申请日:2021-02-08

    Abstract: 本发明公开了一种跨模态图文匹配的方法、装置及计算机可读存储介质,方法包括:获取图像特征向量和句子特征向量;利用注意力机制聚合图像内的图像特征向量的上下文信息获得视觉短语和句子内的句子特征向量的上下文信息获得文本短语;计算视觉短语和文本短语的模态内相似度;通过交叉注意力层获取视觉短语在文本语义空间的特征表示和文本短语在视觉语义空间的特征表示,计算获得图像到句子的跨模态相似度和句子到图像的跨模态相似度;根据预设权重、模态内相似度和跨模态相似度计算获得图像到句子的综合相似度和句子到图像的综合相似度;根据综合相似度获得图像与句子的关联结果,本发明提供的方法具有匹配速度快、匹配准确性高的特点。

Patent Agency Ranking