-
公开(公告)号:CN119091335B
公开(公告)日:2025-02-18
申请号:CN202411594179.8
申请日:2024-11-08
Applicant: 之江实验室
IPC: G06V20/17 , G06V10/82 , G06V10/774 , G06V10/74 , G06V10/80 , G06N3/045 , G06N3/0464
Abstract: 本说明书公开了一种航拍图像检测方法、装置、存储介质及电子设备,通过获取航拍图像以及对应的各第一物体标签,作为训练样本,并确定对应的标注,通过编码器得到各尺度下的各图像特征、各物体特征以及各第一物体标签对应的各文本特征。通过解码器确定增强文本特征以及确定各增强物体特征,通过检测层确定各增强物体特征对应的目标文本特征以及目标标签。根据检测层的输出与标注之间的差异确定总损失,以总损失最小为调整目标,训练航拍检测模型。通过将尺度特征融入文本特征,使得训练完成的航拍检测模型可将多尺度的文本特征作为引导,进一步促进图像与文本特征的对齐,增强图像特征与文本特征之间的关联,突破了传统航拍检测在类别上的限制。
-
公开(公告)号:CN119091335A
公开(公告)日:2024-12-06
申请号:CN202411594179.8
申请日:2024-11-08
Applicant: 之江实验室
IPC: G06V20/17 , G06V10/82 , G06V10/774 , G06V10/74 , G06V10/80 , G06N3/045 , G06N3/0464
Abstract: 本说明书公开了一种航拍图像检测方法、装置、存储介质及电子设备,通过获取航拍图像以及对应的各第一物体标签,作为训练样本,并确定对应的标注,通过编码器得到各尺度下的各图像特征、各物体特征以及各第一物体标签对应的各文本特征。通过解码器确定增强文本特征以及确定各增强物体特征,通过检测层确定各增强物体特征对应的目标文本特征以及目标标签。根据检测层的输出与标注之间的差异确定总损失,以总损失最小为调整目标,训练航拍检测模型。通过将尺度特征融入文本特征,使得训练完成的航拍检测模型可将多尺度的文本特征作为引导,进一步促进图像与文本特征的对齐,增强图像特征与文本特征之间的关联,突破了传统航拍检测在类别上的限制。
-