-
公开(公告)号:CN120014488A
公开(公告)日:2025-05-16
申请号:CN202510043915.9
申请日:2025-01-10
Applicant: 中国科学院自动化研究所
IPC: G06V20/17 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明提供一种精细化对齐学习的导航模型训练方法、导航方法及装置,该精细化对齐学习的导航模型训练方法包括:对从无人机航拍图像中提取的视觉特征、语义特征和空间特征进行加权融合,得到语义网格特征;基于多项辅助预测任务根据语义网格特征对实体与地标对象的精细化对齐关系进行显示学习,得到视觉表征;以精细化空中视觉对话导航数据集为训练样本,以视觉表征为输入特征,以综合损失为损失函数对导航模型进行迭代训练,得到空中视觉对话导航模型;其中,综合损失基于导航损失函数和多项辅助预测任务对应的损失函数确定。本发明方法通过全面融合多模态特征,提高了无人机在复杂场景中的导航精度、对齐能力和任务执行效率。